標籤:分析 tar filter 設計 pagerank 分詞 分布 抓取 order
第一課 Python入門
知識點1:Python安裝
知識點2:常用資料分析庫NumPy、Scipy、Pandas、matplotlib安裝
知識點3:常用進階資料分析庫scikit-learn、NLTK安裝
知識點4:IPython的安裝與使用
知識點5:Python2與Python3區別簡介
實戰項目:Python常用科學計算
第二課 準備資料與Numpy
知識點1:多維陣列對象
知識點2:元素層級處理函數
知識點3:利用數組進行資料處理
知識點4:檔案輸入輸出
知識點5:線性代數相關功能以及線性代數基礎知識
知識點6:隨機數的產生
實戰項目:通過實際代碼示範NumPy的多維陣列與線性代數矩陣操作,以及資料輸入輸出
第三課 Python資料分析主力Pandas
知識點1:基本資料結構
知識點2:準系統:索引,選取,過濾,排序...
知識點3:基本統計功能
知識點4:缺失資料處理
知識點5:層次化索引
實戰項目:通過實際代碼示範pandas處理及統計資料
第四課 資料擷取與處理
知識點1:工業界常見資料格式與形態
知識點2:python對不同格式的資料讀寫
知識點3:pandas資料處理複習
知識點4:資料簡易爬取與解析
知識點5:Regex:快捷捕捉你想要的資訊
實戰項目:簡易網頁爬取與資料解析處理
第五課 資料視覺效果Matplotlib
知識點1:資訊可視化和資料視覺效果的基本原理
知識點2:常見可視化的方式
知識點3:如何針對資料特點設計可視化方案
實戰項目:一典型可視化方式的實現(提供課堂ipython代碼執行個體)
第六課 使用NLTK進行Python文本分析
知識點1:分詞
知識點2:詞性標註
知識點3:情感分析
知識點4:詞形還原
知識點5:拼字檢查
知識點6:文本分類
實戰項目:一個典型文本分類流程的實現
第七課 python 社交網路分析igraph
知識點1:社交網路分析指標介紹
知識點2:pagerank演算法
知識點3:igraph中多種社區發現演算法介紹
實戰項目:如何構造一個圖,節點、邊操作,以及基礎圖演算法使用和可視化案例
第八課 Python機器學習scikit-learn
知識點1:scikit-learn簡介
知識點2:機器學習的處理流程:以scikit-learn為例
知識點3:scikit-learn的最佳化方法(並行化處理,cython的使用等)
實戰項目:以手寫數字識別和樓價預估為例,如何利用sklearn進行機器學習的特徵轉化、建模、可視化,以及最後的模型評估
第九課 資料科學完整案例
知識點1:資料擷取與解析:你愛的足球隊
知識點2:用“資料”的眼睛去看球:“一個人完成的央視資料統計”
知識點3:球員資料統計與可視化:“到底誰是最好的球員?”
實戰項目:從抓取資料、解析資料、分析資料,到可視化、建模完整走一遍,從實際案例中一舉窺探數學科學完整工作流程
第十課 Python分散式運算
知識點1:Python多進程模組Multiprocessing
知識點2:Python使用Hadoop分散式運算庫mrjob
知識點3:Python使用Spark分散式運算庫PySpark
實戰項目:分別使用MapReduce和Spark實現wordcount
:
百度網盤下載
Python資料分析班