標籤:
3月上海開班時間:
管理員(3月1-4日)Cloudera Certified Administrator For Apache Hadoop;
開發人員(3月23-26日)Cloudera Certifed Developer For Spark And Hadoop;
【其他課程安排請諮詢】15601685012(龔老師)
QQ群:Cloudera大資料培訓 308453209
課程內容:
【Cloudera Certified Administrator For Apache Hadoop 管理員課程】
課時:4天
學習系統管理的概念和Apache Hadoop的最佳實務;
從安裝和配置到負載平衡和調優;
這個4天的的課程通過動手時間來賦予你部署的經驗;
以及更多的安全方面的經驗和故障排除;
課程結束後,學員被鼓勵去參加Cloudera和Apache Hadoop管理員(CCAH)考試,可以代理報名;
【課程內容】
1、HadoopDistributed File System(HDFS)
2、YARN/MapReduce的工作原理
3、如何最佳化Hadoop機群所需要的硬體設定
4、搭建Hadoop機群所需要考慮的網路因素
5、Hadoop機群維護和控制
6、如何利用Hadoop配置選項進行系統效能調優
7、如何利用FairScheduler為多使用者提供服務等級保障
8、Hadoop機群維護和監控
9、如何使用Flume從動態產生的檔案載入到Hadoop
10、如何使用Sqoop從關係型資料載入資料
11、Hadoop生態系統工具(如Hive、Impala、Pig和Base)
【學員基礎】
具備基本Linux系統管理經驗。不需要事先掌握Hadoop相關知識。
【授課形式】
案例教學+上機實踐
【Cloudera Certifed Developer For Spark And Hadoop 開發人員課程】
課時:4天
學習HadoopDistributed File System(HDFS)基礎和MapReduce架構以及如何利用其API來編寫程式,
討論為更大型的工作流程而設計技術。
這門4天的課程涵蓋了為MapReduce程式修複漏洞和最佳化效能所需的進階技巧。
程式員課程也引入了Apache生態項目比如Hive、Pig、HBase、Flume和Oozie。
【課程內容】
1、MapReduce與HDFS核心知識以及如何編寫MapReduce程式
2、Hadoop開發的最佳實務,調試、實現工作流程及通用演算法
3、如何利用Hive、Pig、Sqoop、Flume、Oozie及其他Hadoop的組件
4、按需定製WritableComparables與InputFormats處理複雜的資料類型
5、利用MapReduce編寫、執行串連操作以整合不同資料集合
6、用於現實世界資料分析所需的進階HadoopAPI主題
7、用Java寫MapReduce程式,用Streaming寫MapReduce程式
8、調試MapReduce代碼的策略,利用localjobrunner在本地測試MapReduce代碼
9、Partitioners和Reducers如何一起工作,定製化Partitioners
10、定製Writable和WritableComparable
11、用SequenceFile和Avro資料檔案儲存位元據
【學員基礎】
該課程適合具有一定編程經驗的程式開發人員。由於課程中需要完成Hadoop相關編程練習,熟悉Java者優先
【授課形式】
案例教學+上機實踐
【Cloudera 資料分析課程】
課時:4天
針對任何需要在Hadoop上即時地通過SQL和熟悉的指令碼來管理、操縱和查詢大型複雜資料的人。
學習Apache Pig、Apache Hive和Cloudera Impala如何通過過濾聯結和其他使用者自訂的功能
來支援資料的轉型和分析。
【課程內容】
1、Hadoop生態圈、實驗情境介紹、用Hadoop工具匯入資料
2、pig的特性、使用案例、和pig互動、pig Latin文法、Field定義、用pig執行ETL流程
3、pig處理複雜資料,複雜/nested嵌套的資料類型、用pig分析廣告戰役的資料
4、pig的多資料群組操作,pig連結多資料群組、用pig分析離散的資料群組
5、用流處理和UDFs擴充pig,Macros和Imports、contributed functions,用其他語言和pig一起處理資料
6、pig故障排查和最佳化,用web介面排查一個故障的任務、Data採樣和故障排查、理解執行計畫、提高pig任務效能
7、hive表結構和資料儲存、對比hive和傳統資料庫、hive vs.pig、hive使用案例
8、hive的關係資料分析、資料管理、文本處理、最佳化及擴充,在shell、指令碼和hue上運行hive查詢
9、impala和hive、pig、關聯式資料庫的不同、使用impala shell
10、採樣impala分析資料,過濾、排序and limiting results,提升impala效能,impala的互動式分析
11、對比map reduce、pig、hive、impala和關聯式資料庫
【學員基礎】
該課程適合有SQL經驗和基本UNIX和Linux命令的資料分析師、商務分析師和管理員
事先無需Java和Apache Hadoop的經驗
【授課形式】
案例教學+上機實踐
==============================================================
授課名師 龔少成 (cloudera售前技術經理)
- Cloudera公司系統工程師
- Cloudera管理員認證講師
- 在加入Cloudera之前為Intel中國大資料部門解決方案部技術負責人,帶領過Intel大資料團隊成功實施過國內最早的一批大資料平台建設項目,包括中國農業銀行,太平洋保險和上海電信大資料平台,有著非常豐富的項目實戰經驗。在加入Intel之前,龔少成是eBay的進階軟體工程師,負責eBay電子商務網站的計費和支付系統建設。
==================授課現場圖=====================
北京大資料管理員CCAH培訓
認證樣本
===================================================================
上海開發人員CCDH培訓
大資料培訓班 cloudera公司講師面對面授課 CCDH CCAH CCP