標籤:哲學 限時免費 視頻教程 多個 panda 基礎 dbf cli 18C
2018年將會是人工智慧和機器學習快速發展的一年,有專家表示:相較之下Python比Java更加接地氣,也自然而然地成為機器學習的慣用語言
在資料科學方面,Python的文法與數學文法最為接近,因此是數學家或經濟學家等專業人士最容易理解和學習的語言。本文將羅列機器學習和資料科學應用程式中最有用的十大Python工具
機器學習工具
1、Shogun
SHOGUN是一個機器學習工具箱,專註於支援向量機(SVM)的學習工具箱。它是用C++編寫的,早在1999年就已經建立,是最古老的機器學習工具之一,它提供了廣泛的統一機器學習方法,旨在為機器學習提供透明和可訪問的演算法,並為任何對此領域感興趣的人提供免費的機器學習工具。
Shogun提供了一個記錄完善的Python介面用於統一的大規模學習,並提供高效能速度。不過,Shogun的缺點就是它的API很難使用。(項目地址:https://github.com/shogun-toolbox/shogun)
2、Keras
Keras是一個進階神經網路API,提供了一個Python深度學習庫。對於任何初學者來說,這是機器學習的最佳選擇,因為與其他庫相比,它提供了一種更簡單的表達神經網路的方法。Keras由純Python編寫而成並基Tensorflow、Theano以及CNTK後端。
據官方網站稱,Keras側重於4個主要指導原則,即方便使用性,模組化,易擴充性和與Python協作。然而,就速度而言,Keras 相對還是比較弱的。(項目地址:https://github.com/keras-team/keras)
3、scikit-learn
scikit-learn 是一個 Python 的機器學習項目。是一個簡單高效的資料採礦和資料分析工具。基於 NumPy、SciPy 和 matplotlib 構建。Scikit-Learn提供了一致且便於使用的API網格以及隨機搜尋。其主要優勢演算法簡單而且速度快。Scikit-learn的準系統主要被分為六大部分:分類,迴歸,聚類,資料降維,模型選擇和資料預先處理(項目地址:https://github.com/scikit-learn/scikit-learn)
4、Pattern
Pattern是一個Web挖掘模組,為資料採礦,自然語言處理,機器學習,網路分析和網路分析提供工具。它還附帶完善的文檔,有50多個樣本以及通過350多個單元測試。最重要的是,它是免費的!(項目地址:https://github.com/clips/pattern)
5、Theano
Theano可以說是最成熟的Python深度學習庫之一,Theano是以以為希臘畢達哥拉斯哲學家和數學家畢達哥拉斯的妻子的名字命名,Theano的主要功能:與NumPy緊密整合,用符號式語言定義你想要的結果,該架構會對你的程式進行編譯,來高效運行於 GPU 或 CPU。
它還提供了定義,最佳化和評估數學運算式的工具,並且可以在Theano上構建大量其他庫,以探索其資料結構。儘管如此,使用Theano還是有一些缺點的; 比如學習它的API可能需要很長時間,而另一些人則認為Theano大模型的編譯時間顯的它不夠高效(項目地址:https://github.com/Theano/Theano)
資料科學工具
1、SciPy
SciPy (pronounced "Sigh Pie") 是一個開源的數學、科學和工程計算包。SciPy使用NumPy,IPython或Pandas等各種軟體包為常用的數學和科學編程任務提供庫。當你想操縱電腦上的數字並顯示或發布結果時,此工具是一個很好的選擇,並且它也是免費的。(項目地址:https://github.com/scipy/scipy)
2、Dask
Dask 是一個用於分析計算的靈活的並行計算庫。同樣,通過更改只有幾行代碼,你可以快速對現有代碼進行平行處理,因為它的DataFrame與Pandas庫中的相同,它的Array對象的工作方式類似於NumPy能夠並行化以純Python編寫。(項目地址:https://github.com/dask/dask)
3、Numba
此工具是一種開源最佳化編譯器,它使用LLVM編譯器基礎結構將Python文法編譯為機器碼。在資料科學應用中使用Numba的主要優勢在於它使用NumPy數組來加速應用程式的能力,因為Numba是一個支援NumPy的編譯器。就像Scikit-Learn一樣,Numba也適用於機器學習應用。(項目地址:https://github.com/numba/numba)
4、HPAT
高效能分析工具包(HPAT)是一個基於編譯器的大資料架構。它將Python中的分析/機器學習代碼自動擴充到群集/雲環境中的大資料分析和機器學習,並可以使用@jit裝飾器最佳化特定功能。(項目地址:https://github.com/IntelLabs/hpat)
5、Cython
使用數學密碼或密碼迴圈啟動並執行代碼時,Cython是您的最佳選擇。Cython是一款基於Pyrex的原始碼翻譯器,可快速產生Python擴充模組(extention module)的工具。Cython語言非常接近Python語言,但是Cython還支援調用C函數並在變數和類屬性上聲明C類型。這允許編譯器從Cython代碼產生非常高效的C代碼。(項目地址:https://github.com/cython/cython)
福利:5月10日(周四)晚八點:【線上直播】排序評估神器---交叉實驗方法之介紹
報名方式:識別宣傳圖二維碼,成功登陸網站後立即報名!
關注公眾帳號
【飛馬會】
▼
往期福利
關注飛馬會公眾號,回複對應關鍵詞打包下載學習資料;回複“入群”,加入飛馬網AI、大資料、專案經理學習群,和優秀的人一起成長!
回複 數字“1”下載從入門到研究,人工智慧領域最值得一讀的10本資料(附下載)
回複 數字“2”機器學習 & 資料科學必讀的經典書籍,內附資料包!
回複 數字“3”走進AI & ML:從基本的統計學到機器學習書單(附PDF下載)
回複 數字“4”瞭解人工智慧,30份書單不容錯過(附電子版PDF下載)
回複 數字“5”大資料學習資料下載,新手攻略,資料分析工具、軟體使用教程
回複 數字“6”AI人工智慧:54份行業重磅報告匯總(附下載)
回複 數字“7”TensorFlow介紹、安裝教程、Image Recognition應用(附安裝包/指南)
回複 數字“8”大資料資料全解析(352個案例+大資料交易白皮書+國內外政策匯篇)
回複 數字“9”乾貨 | 薦讀10本大資料書籍(初級/中級/進階)成為大資料專家!
回複 數字“10”麥肯錫160頁報告:2030年全球將可能8億人要被機器搶飯碗
回複 數字“11”50本書籍大禮包:AI人工智慧/大資料/Database/Linear Algebra/Python/機器學習/Hadoop
回複 數字“12”小白| Python+Matlab+機器學習+深度神經網路+理論+實踐+視頻+課件+源碼,附下載!
回複 數字“13”大資料技術教程+書籍+Hadoop視頻+大資料研報+科普類書籍
回複 數字“14”小白| 機器學習和深度學習必讀書籍+機器學習實戰視頻/PPT+大資料分析書籍推薦!
回複 數字“15”大資料hadoop技術電子書+技術理論+實戰+原始碼分析+專家分享PPT
回複 數字“16”100G Python從入門到精通!自學必備全套視頻教程+python經典書籍!
回複 數字“17”【乾貨】31篇關於深度學習必讀論文匯總(附論文)
回複 數字“18”526份行業報告+白皮書:AI人工智慧、機器人、智能出行、智能家居、物聯網、VR/AR、 區塊鏈等(附下載)
回複 數字“19”800G人工智慧學習資料:AI電子書+Python語言入門+教程+機器學習等限時免費領取!
回複 人工智慧下載《FMI人工智慧與大資料峰會嘉賓演講PPT》
回複 AI 江湖下載《十大AI江湖領域》
回複 ML實踐下載《機器學習實踐經驗指導(英文版)》
回複 DL論文下載《深度學習100篇以上論文資料》
回複 演算法 下載《資料採礦十大經典演算法》
回複 6.10 下載《6.10餓了麼&飛馬網專案管理實踐PPT》
10大最受歡迎的機器學習和資料科學Python庫