標籤:hadoop2教程
課程大綱:
第1周 Hadoop生態系統概述以及版本演化
概要介紹Hadoop生態系統及其版本演化曆史,並給出hadoop版本選擇建議。
第2周 HDFS 2.0 原理、特性與基本架構
介紹HDFS 2.0原理與架構,並與HDFS 1.0進行對比。介紹HDFS 2.0新特性,包括快照、緩衝、異構儲存架構等
第3周 YARN應用情境、基本架構與資源調度
介紹YARN是什麼、基本原理與架構,並剖析其調度策略。
第4周 MapReduce 2.0基本原理與架構
介紹計算架構MapReduce基本原理與架構
第5周 MapReduce 2.0編程實踐(涉及多語言編程)
手把手介紹如何用java、C++、php等語言編寫MapReduce程式
第6周 HBase應用情境、原理與基本架構
介紹HBase應用情境、原理和架構
第7周 HBase編程實踐(涉及多語言編程)
手把手介紹如何用Java、C++、Python等語言編寫HBase用戶端程式。
第8周 HBase案例分析
介紹幾個HBase典型應用案例,包括互連網應用案例和銀行應用案例。
第9周 Zookeeper部署及典型應用
介紹Zookeeper是什麼,在hadoop生態系統中的地位
第10周 Hadoop資料入庫系統Flume與Sqoop
介紹如何使用flume和sqoop兩個系統將外部流式資料(比如網站日誌,使用者行為資料等)、關係型資料庫(比如MySQL、Oracle等)中的資料匯入Hadoop中進行分析和挖掘
第11周 資料分析系統Hive與Pig應用與比較
介紹如何使用hive和pig分析hadoop中的海量資料
第12周 資料採礦工具包Mahout
介紹如何使用mahout提供的資料採礦和機器學習演算法進行海量資料採礦
第13周 工作流程引擎Oozie與Azkaban應用
介紹如何使用Oozie和azkaban對MapReduce作業、Pig/hive作業等進行統一管理和調度
第14周 兩個綜合案例:日誌分析系統與Machine Learning Platform for AI
介紹兩個典型的互連網應用案例,進一步深入領悟hadoop生態系統中各個系統的應用情境和解決實際問題的方式。
: http://pan.baidu.com/s/1qW4rPSg 密碼: 7ohd
Hadoop2.X大資料平台V3視頻教程|Hadoop2視頻教程