標籤:
中國資訊化培訓中心特推出了大資料技術架構及應用實戰課程培訓班,通過專業的大資料Hadoop與Spark技術架構體系與業界真實案例來全面提升大資料工程師、開發設計人員的工作水平,旨在培養專業的大資料Hadoop與Spark技術架構專家,更好地服務於各個行業的大資料項目開發和落地實施。
2015年近期公開課安排:(全國巡迴開班)
08月21日——08月23日大連
09月23日——09月25日北京
10月16日——10月18日成都
11月27日——11月29日深圳
12月24日——12月26日廣州
01月27日——01月29日杭州
招生對象:
大資料Hadoop與Spark技術的應用開發工程師
大資料分析與挖掘工程師
大資料集群營運工程師
大資料項目的IT管理員
大資料項目規劃的諮詢人員
對Hadoop與Spark大資料技術感興趣的愛好者
打算上線大資料項目及具有大資料應用需求的各行業的公司資訊化技術與管理員
具備一定的Java和Linux基礎的尤佳。
培訓認證:中國資訊化培訓中心頒發的《大資料Hadoop開發進階架構師》認證。
收費標準:5800元/人
公開課培訓大綱:(內訓方案可定製)
議程 |
培訓模組 |
培訓要點 |
第一天 上午 |
一、大資料技術基礎入門 |
1.大資料的產生背景、發展曆程 2.大資料和雲端運算的關係 3.大資料應用需求以及潛在價值分析 4.業界最新的大資料技術發展態勢與應用趨勢 5.大資料項目的技術選型與架構設計 6.“互連網+”時代下的電子商務、製造業、零售批發業、電信電訊廠商、互連網金融業、網上銀行、電子政務、移動互連網、教育資訊化等行業應用實踐與應用案例剖析 |
二、業界主流的大資料技術產品與項目解決方案 |
7.國內外主流的大資料解決方案介紹 8.當前大資料解決方案與傳統資料庫方案的剖析比較 9.Apache大資料平台方案剖析 10.CDH大資料平台方案剖析 11.HDP大資料平台方案剖析 12.開源的巨量資料生態系統平台剖析 |
三、Hadoop與Spark大資料處理平台 |
13.Hadoop的發展曆程以及產業界的實際應用介紹 14.Hadoop大資料平台架構,以及PB級大資料處理工作原理與機制 15.Hadoop的核心組件剖析 16.Spark的發展曆程以及業界的實際應用介紹 17.Spark即時大資料處理平台架構,以及記憶體大資料處理工作原理與機制 18.Spark的核心組件剖析 |
第一天 下午 |
四、大資料擷取與分布式訊息訂閱系統 |
19.Flume-NG資料擷取系統的資料流模型、平台架構、叢集部署與配置應用實戰 20.Kafka分布式訊息訂閱系統的應用介紹、平台架構、叢集部署與配置應用實戰 21.Scribe分布式日誌收集系統的簡介、工作原理、平台架構、叢集部署與配置應用實戰 22.ZooKeeper分布式協調服務系統的工作原理、平台架構、叢集部署與配置應用實戰 |
五、大資料分布式儲存系統 |
23.Distributed File SystemHDFS的簡介 24.HDFS系統的主從式平台架構和工作原理 25.HDFS核心技術講解 26.HDFS應用開發實戰 27.HDFS叢集的安裝、部署、配置與效能最佳化技巧 28.分布式KVStore for Redis系統介紹、平台架構、核心技術以及應用開發 29.PB及大資料存放區系統的項目案例分析 |
六、大資料MapReduce與Yarn平行處理平台 |
30.MapReduce並行計算模型 31.MapReduce作業執行與調度技術 32.第二代大資料計算架構Yarn的工作原理以及DAG並存執行機制 33.MapReduce應用開發環境的部署,以及大資料平行處理應用程式開發 34.MapReduce進階編程技巧與效能最佳化實踐 35.MapReduce與Yarn項目案例實踐 |
第二天 上午 |
七、大資料Spark即時處理平台 |
36.記憶體計算模型和即時處理技術介紹 37.Spark分布式即時處理架構及工作原理 38.Spark叢集的平台架構及其生態系統組件剖析 39.Spark SQL應用實踐 40.Spark Streaming應用實踐 41.MLib/MLBase即時機器學習應用實踐 42.GraphX即時圖資料處理應用實踐 43.Spark即時處理叢集的安裝部署與配置最佳化 44.Spark的編程開發應用實戰 45.Spark與Hadoop的對接整合解決方案實踐 |
八、Storm流式資料處理平台 |
46.Storm串流系統介紹、平台架構以及工作原理 47.Storm叢集安裝部署與配置最佳化 48.Storm日誌分析項目應用實戰 |
第二天 下午 |
九、HBase分散式資料庫管理系統 |
49.NoSQL資料庫與NewSQL資料庫技術介紹,及其在半結構化和非結構化大資料方面的應用實踐 50.HBase分散式資料庫簡介、資料模型以及工作原理 51.HBase分散式資料庫叢集的平台架構和關鍵技術剖析 52.HBase應用項目開發技巧,以及用戶端開發實戰 53.HBase表設計與資料操作以及資料庫管理API調用 54.HBase叢集的安裝部署與配置最佳化 55.HBase叢集的營運與監控管理 |
|
十、Cassandra資料管理系統 |
56.Cassandra資料存放區管理系統的應用介紹 57.Cassandra叢集的平台架構以及核心關鍵技術 58.Cassandra一致性雜湊演算法與資料對象分布策略 59.Cassandra叢集的安裝部署與配置最佳化 60.Cassandra應用開發實戰 |
第三天 上午 |
十一、記憶體資料庫管理系統叢集 |
61.Impala即時查詢系統的應用介紹 62.Impala即時查詢系統平台架構、核心關鍵技術剖析 63.Impala即時查詢系統的部署與應用開發實踐 64.Redis記憶體資料庫介紹,以及業界應用案例 65.Redis記憶體資料庫叢集架構以及核心技術剖析 66.Redis叢集的安裝部署與應用開發實戰 |
十二、大型資料倉儲Hive叢集平台 |
67.基於Hadoop的大型分布式資料倉儲基礎知識,以及在行業中的應用實踐案例 68.基於Spark的即時資料倉庫叢集基礎知識,以及在行業中的應用實踐案例 69.Hive大資料倉儲簡介以及應用介紹 70.Hive資料倉儲叢集的平台體繫結構、核心技術剖析 71.Hive Server工作原理與應用技巧 72.Hive資料倉儲叢集的安裝部署與配置最佳化 73.Hive應用開發技巧 74.Hive QL定義以及應用 75.Hive資料倉儲表與表分區、表操作、資料匯入匯出、用戶端操作技巧 76.Hive資料倉儲報表設計、HWI、CLI用戶端示範以及使用者自訂函數(UDF)的開發實踐 |
第三天 下午 |
十三、Mahout大資料分析挖掘平台 |
77.大資料分析挖掘技術介紹,以及行業大資料採礦應用案例 78.Mahout大資料採礦平台的體系架構、核心演算法與關鍵技術運用 79.基於Mahout的資料採礦應用程式開發實戰 80.Mahout叢集的安裝部署與配置最佳化 81.整合Mahout與Hadoop整合大資料採礦平台應用實戰 |
十四、大資料智能化ETL操作以及Hadoop叢集營運監控工具平台應用 |
82.Hadoop與DBMS之間進行資料轉換的架構 83.Sqoop匯入匯出資料的工作原理,以及Sqoop叢集安裝部署與配置 84.Kettle叢集的平台架構、核心技術工作原理以及應用案例 85.Kettle叢集安裝部署與配置,以及應用開發實戰 86.利用Sqoop實現MySQL與Hadoop叢集之間的資料匯入匯出互動程式 87.Hadoop巨量資料營運監控系統HUE平台的安裝部署與配置最佳化 |
十五、大資料項目應用實戰 |
88.根據布置的實際應用案例,開展大資料完整項目部署設計和應用開發實踐 |
成都大資料Hadoop與Spark技術培訓班