BigData > Data Engineering 과정
스파크로 구축하는 분산처리 빅데이터 플랫폼
- 강의기간
-
2020-02-17 ~ 2020-02-21
- 난이도
- 중급
- 수강일
- 5일, 09:30~17:30
- 수강료
-
1,500,000원
KRW (KR)
- 환급
-
비환급과정
※ 비환급과정(면세) 입니다.
- 과목코드
- HJ0T0
※ 본 과정을 신청하는 경우 한국 교육서비스의 Terms&Conditions 에 동의하는 것으로 간주합니다. |
과정소개 |
- 빅데이터 플랫폼,Hadoop Ecosystem 기술,HDFS, Mapreduce를 이해하고 하드웨어나 네트워크 등 실제 빅데이터 플랫폼 방법을 이해합니다.
- Spark 기본적인 사용법 및 기술을 이해하여 빠른 데이터 분석을 위한 Spark RDD, SQL Stream, ML 등을 실습합니다.
- Hadoop, Spark를 이용하여 데이터 적재, 처리, 분석, 머신러닝까지 빅데이터 분석과 모델링 과정을 다룹니다.
|
수강대상 |
- IT/보안 분야에 종사하시는 분
- 조직의 빅데이터 플랫폼에 관심 있는 분
- 조직이 스파크에 통한 데이터 처리에 관심 있으신 분
- 스파크 SQL로 쿼리하여 데이터 처리에 관심이 있는 분
- 스파크로 머신러닝에 활용에 관심이 있는 분
|
교육내용 |
Module 1 – Hadoop 기초와 빅데이터 플랫폼의 개념 및 설계 이해 • 빅데이터 플랫폼과 하둡 • 빅데이터 플랫폼 구축기획 및 설계 • Hadoop의 기초와 Spark의 개념 Module 2 –Hadoop 데이터 처리와 분석 기반을 위한 Spark Core • Spark CORE 이해와 데이터 처리 • Spark RDD 이해와 데이터 처리 및 분석 Module 3 - 효율적인 데이터 처리와 분석을 위한 Spark SQL • Spark의 개념과 아키텍처를 이해 • Spark 기본적인 사용법과 연동방법 • Spark API 깊이 파헤치기 Module 4 – 빠른 데이터 분석을 위한 Spark • SQL을 사용할 수 있게 해주는 Spark SQL의 이해와 실습 • Spark SQL로 멋진 쿼리를 실행하기 • Spark 애플리케이션 활용하기 Module 5 - 빠른 데이터 분석을 위한 Spark • Spark API 활용 • Spark 스트리밍으로 데이터를 흐르게 하기 • Spark ML로 만드는 분류와 군집화
|
선수과목 |
|
다음과목 |
|
- 교육장
- 서울 한국HPE 강남교육센터
- 강의장
- 속리산
- 주소
- 서울 서초구 서초동 1302-2 대지프라자 6층
- 전화
- 1661-9080
- 팩스
- 02-3470-2200
- 주차
-
불가능
- 안내
-
- 9호선 신논현역 7번 출구 50M 직진, SK주유소에서 좌회전 후 30M 전방 도미노피자 건물 6F
- 2호선 강남역 9번 출구
시내버스 : 146, 341
마을버스 : 11 {삼호아파트 하차 (2 정거장)}
도보 : 강남역에서 20분 거리
* 주차불가