스파크는 드문 만능 선수, 여러 번 반복, 절충 주의 데이터 웨어하우징, 스트리밍로 시작 그리고 컴퓨팅 패러다임을 그래프 컴퓨팅 플랫폼 이며 메모리 컴퓨팅 기반 Hadoop 보다 더 성능이, 버클리 캘리포니아 대학교의 Amplab에서 발생 하는 클러스터입니다. 스파크는 클라우드 컴퓨팅 대용량 데이터 스트림 처리, 그래프 기술, 기계 학습, NoSQL 쿼리 및 다른 측면의 통합된 클라우드 컴퓨팅 큰 데이터 필드 헤게모니를 직접 누워 완벽 한 생태계와 모든 핵심 문제를 해결 하기 위해 통합된 기술 스택을 사용 합니다.
대중화와 불꽃 기술의 대중화, 직업적인 재능에 대 한 수요가 증가 하고있다. 뜨거운, 지불의 수백만을 쉽게 점화 전문가 미래에 또한 이다. 그리고 스파크 마스터 되 고 싶어, 또한 필요 하나 모집 입력, 내부 강도에서: 일반적으로 말하자면, 다음 단계를 통해 갈 필요가:
처음 단계: 스칼라 언어 능력
스칼라 언어, 세련 되 고 우아한 점화 프레임 워크 작성 됩니다. 스파크 마스터 되기 위해 당신은 스파크 소스 코드를 읽을 수 있다, 당신은 스칼라;을 마스터 해야 합니다
스파크는 다중 언어 자바, 파이썬와 등을 사용 하 여 개발 될 수 있다, Api 유지 되며 항상 가장 빠르고 가장 지원 개발 될 스칼라의 API, 그래서 당신은 마스터 스칼라를 작성 배포 하는 복잡 하 고 높은-성능 스파크 프로그램;
특히, 스칼라의 특성에 능숙, 적용, 함수형 프로그래밍, 제네릭, 인버터 및 공;
2 단계: 스파크 플랫폼 자체에 능력 개발자 API 제공
마스터 스파크, 마스터 다양 한 변환 및 동작 기능;의 사용에서에서 RDD의 개발 모드
마스터 넓은 의존 및 좁은 의존 및 혈통 메커니즘 불꽃;
프로세스, 단계 나누기, 클러스터에 스파크 응용 프로그램 전송의 기본 프로세스와 작업자 노드 재단의 작동 원리와 같은 컴퓨팅 RDD 마스터
단계 III: 깊은 스파크 커널
이 단계는 스파크 커널 섹션으로 드릴 다운 하려면 소스 연구의 스파크 프레임 워크를 통해 주로 이다:
마스터 스파크 작업 제출 프로세스 소스 코드;
마스터 스파크 클러스터 소스 코드의 작업 일정
특히, Dagscheduler, TaskScheduler 및 작업자 노드; 내 작업의 각 단계 세부 사항에서 숙련 될
클래스 IV: 마스터링 불꽃에 따라 코어 프레임 워크의 사용
클라우드 컴퓨팅 시대의 전형으로 스파크, 실시간 스트리밍, 그래프 기술, 기계 학습, NoSQL 쿼리에서 상당한 이점을 등등, 상어, 등의 프레임 워크의 사용에서은 우리가 사용 하 여 점화 대부분의 시간, 스트리밍 등을 촉발.:
스파크 스트리밍 매우 우수한 실시간 흐름 처리의 Dstream, 변환 및 검사점, 등을 마스터 하는 프레임 워크입니다.
스파크 라인 통계 분석 기능, 스파크 SQL, 효율성의 기능의 오프 라인 통계 분석의 도입에 따라 상어에 스파크 1.0.0 버전을 크게 개선 했습니다, 그리고 숙달;에 초점
마스터는 원리와 불꽃 기계 학습과 GRAPHX;의 사용
클래스 5: 비즈니스 수준의 불꽃 프로젝트
프로젝트의 건축 설계, 기술 분석, 개발, 운영의 사용을 포함 하 여, 스파크의 모든 측면을 침투 스파크 프로젝트의 완전 한 대표를 통해 스파크 프로젝트의 대부분을 얼굴 침착 하 게 수 있도록 이러한 단계와 세부, 각각의 이해를 완료 합니다.
클래스 VI: 스파크 솔루션을 제공 하
철저 하 게 불꽃 프레임 워크 소스 코드의 모든 세부 사항을 파악합니다
솔루션; 아래 서로 다른 시나리오에 점화를 제공 하기 위해 다양 한 비즈니스 시나리오의 요구에 따라
실제 필요에 따라 스파크 프레임 워크의 두 개발, 구축 하 고 스파크 프레임 생성 됩니다.
마스터 스파크로 설명 되었습니다 6 단계의 첫 번째 및 두 번째 단계를 점진적으로 자율 학습에 의해 완료 될 수 있다, 다음 세 단계는 마스터에 의해 만들어진 최고의 또는 전문가 가이드 단계, 마지막 단계에 의해 단계를 기본적으로 "아무 모집 승 모집을" 기간, 많은 것 들을 마음으로 달성 될 것 이다.