基於Hadoop離線巨量資料分析平台項目實戰

來源:互聯網
上載者:User

標籤:

基於Hadoop離線巨量資料分析平台項目實戰 
課程學習入口:http://www.xuetuwuyou.com/course/184
課程出自學途無憂網:http://www.xuetuwuyou.com


課程簡介:
某購物電商網站資料分析平台,分為收集資料、資料分析和資料展示三大層面。其中資料分析主要依據大資料Hadoop生態系統常用組件進行處理,此項目真實的展現了大資料在企業中實際應用。
 

課程內容
(1)檔案收集架構 Flume
①Flume 設計架構、原理(三大組件)
②Flume 初步使用,即時採集資料
③實際案例:使用Flume監控資料,即時收集儲存HDFS中

(2)巨量資料分析平台架構
①資料平台三大模組
讓技術產生價值!
②分析平台業務資料
③大資料平台技術選型和搭建配置測試

(3)資料分析平台七大業務分析
①具體的七大業務分析,針對不同的資料
②將資料收到 HDFS/Hive/HBase,使用MapReduce和Hive離線分析,其中涉及地區分析、使用者相關資訊分析及外鏈分析等。
③依據業務深入MapReduce使用
④資料處理時,針對不同問題如何最佳化調整等


 
課程目錄:
第1章:大資料離線項目:企業大資料項目業務及設計
1.大資料項目的開發流程  
2.大資料的應用領域(一)
3.大資料的應用領域(二) 
4.巨量資料分析平台(一) 
5.巨量資料分析平台(二)
6.資料量及叢集規模的規劃(一) 
7.資料量及叢集規模的規劃(二) 
8.企業常見資料分析需求(一) 
9.企業常見資料分析需求(二) 

第2章:大資料離線項目:資料擷取架構Flume
10.Flume的介紹及其架構組成 
11.Flume的安裝部署
12.Flume的測試回合 
13.Flume中配置使用file channel及HDFS sink
14.Flume中配置HDFS檔案產生大小及時間分區 
15.Flume中配置Spooling Dir的使用 
16.Flume中配置Spooling Dir的檔案過濾 
17.Flume中配置扇入架構的介紹 
18.Flume中配置扇入架構的測試實現 
19.Flume中配置扇出架構的實現 
20.Flume中Taildir的介紹及編譯 
21.Flume中Taildir的配置及測試使用 

第3章:大資料離線項目:Nginx+Flume實現資料擷取
22.項目技術架構介紹 
23.項目技術架構圖
24.項目中架構的技術選型 
25.Tengine的介紹及源碼編譯 
26.Tengine的啟動及測試 
27.配置使用service命令管理nginx服務
28.SDK與Nginx關聯測試
29.SDK的設計思路及重要事件類型的介紹 
30.JS SDK 與 JAVA SDK的代碼實現 
31.Nginx中配置自訂收集方案 
32.Flume進行資料擷取 
33.Flume的負載平衡及容錯移轉及美團的使用案例 

第4章:大資料離線項目:ETL的業務分析及實現(一)
34.Nginx日誌分割指令碼的實現(一) 
35.Nginx日誌分割指令碼的實現(二) 
36.Nginx日誌上傳指令碼的實現 
37.ETL的流程分析 
38.資料分析項目的匯入 
39.日誌解析類的實現(一) 
40.日誌解析類的實現(二) 
41.日誌解析類的實現(三) 
42.日誌解析類的實現(四) 
43.ETL具體代碼流程分析 
44.項目中Hbase表的設計 

第5章:大資料離線項目:ETL的業務分析及實現(二)
45. ETL的Map類的實現(一) 
46.ETL的Map類的實現(二) 
47.ETL的Driver類的實現(一)
48. ETL的Driver類的實現(二) 
49.ETL的Driver類的實現(三) 
50.ETL的本地運行測試 
51. ETL的叢集運行測試

第6章:大資料離線項目:資料分析的思路及代碼實現
52.新增訪客的統計分析實現思路(一) 
53.新增訪客的統計分析實現思路(二) 
54.使用MapReduce實現思路分析 
55.Hbase中值和欄位的過濾(一) 
56.Hbase中值和欄位的過濾(二) 
57.Hbase中值和欄位的過濾(三) 
58.新增使用者統計Map代碼的實現(一) 
59.新增使用者統計Map代碼的實現(二) 
60.新增使用者統計Map代碼的實現(三) 
61.新增使用者統計Reduce及Driver代碼的實現(一)
62.新增使用者統計Reduce及Driver代碼的實現(二) 

第7章:大資料離線項目:Hourly分析及可視化展示
63.MapReduce中自訂輸入輸出 
64.新增使用者統計代碼的講解(一) 
65.新增使用者統計代碼的講解(二) 
66.hourly分析-hbase與hive的整合 
67.hourly分析-活躍使用者的分析 
68.hourly分析-會話長度的分析 
69.hourly分析-平均訪問時間長度分析及sqoop匯出 
70.使用zeus實現專案工作調度(一) 
71.使用zeus實現專案工作調度(二) 
72.使用zeus實現專案工作調度(三) 
73.使用zeus實現專案工作調度(四) 
74.資料展示層及Highcharts的使用講解(一) 
75.資料展示層及Highcharts的使用講解(二) 
76.項目總結(一) 
77.項目總結(二) 



hadoop課程整合推薦:

跟軒宇老師學習大資料基礎架構Hadoop
課程觀看地址:http://www.xuetuwuyou.com/course/193

Hadoop架構設計與源碼分析
課程觀看地址:http://www.xuetuwuyou.com/course/88

Hadoop實戰+超大叢集調優 
課程觀看地址:http://www.xuetuwuyou.com/course/97

Hadoop零基礎高端實戰培訓(CDH5、hive、Sqoop) 
課程觀看地址:http://www.xuetuwuyou.com/course/62

基於Hadoop離線巨量資料分析平台項目實戰

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.