BigData > Data Engineering 과정
스파크로 구축하는 분산처리 빅데이터 플랫폼
강의기간
2020-02-17 ~ 2020-02-21
난이도
중급
수강일
5일, 09:30~17:30
수강료
1,500,000원 KRW (KR)
환급
비환급과정
※ 비환급과정(면세) 입니다.
과목코드
HJ0T0
과정개요 교육장 안내
※ 본 과정을 신청하는 경우 한국 교육서비스의 Terms&Conditions 에 동의하는 것으로 간주합니다.
과정소개
  • 빅데이터 플랫폼,Hadoop Ecosystem 기술,HDFS, Mapreduce를 이해하고 하드웨어나 네트워크 등 실제 빅데이터 플랫폼 방법을 이해합니다.
  • Spark 기본적인 사용법 및 기술을 이해하여 빠른 데이터 분석을 위한 Spark RDD, SQL Stream, ML 등을 실습합니다.
  • Hadoop, Spark를 이용하여 데이터 적재, 처리, 분석, 머신러닝까지 빅데이터 분석과 모델링 과정을 다룹니다.
수강대상
  • IT/보안 분야에 종사하시는 분
  • 조직의 빅데이터 플랫폼에 관심 있는 분
  • 조직이 스파크에 통한 데이터 처리에 관심 있으신 분
  • 스파크 SQL로 쿼리하여 데이터 처리에 관심이 있는 분
  • 스파크로 머신러닝에 활용에  관심이 있는 분
교육내용

Module 1 – Hadoop 기초와 빅데이터 플랫폼의 개념  설계 이해

• 빅데이터 플랫폼과 하둡

• 빅데이터 플랫폼 구축기획 및 설계

• Hadoop의 기초와 Spark의 개념

 

Module 2 –Hadoop 데이터 처리와 분석 기반을 위한 Spark Core

• Spark CORE 이해와 데이터 처리

• Spark RDD 이해와 데이터 처리 및 분석

 

Module 3 - 효율적인 데이터 처리와 분석을 위한 Spark SQL

• Spark의 개념과 아키텍처를 이해

• Spark 기본적인 사용법과 연동방법

• Spark API  깊이 파헤치기

 

Module 4 – 빠른 데이터 분석을 위한 Spark

• SQL을 사용할 수 있게 해주는 Spark SQL의 이해와 실습 

• Spark SQL로 멋진 쿼리를 실행하기

• Spark 애플리케이션 활용하기

 

Module 5 - 빠른 데이터 분석을 위한 Spark

• Spark API 활용

• Spark 스트리밍으로 데이터를 흐르게 하기

• Spark  ML로 만드는 분류와 군집화

선수과목
다음과목

Contact us

  • 교육관련 문의
    1661 - 9080
  • HP제품 서비스 문의
    1588 - 3003
HPE 교육센터 BLOG
2016 중소기업 정부지원과정 CAFE