業務解決方案/-資料結構與演算法速成

來源:互聯網
上載者:User

標籤:使用   分詞   貪心   拓撲   分治   man   spfa   兩種   stat   

  業務解決方案:

0. 資料來源載入

1. 特徵工程:   字元轉數值/二值型/多值型 把字元型特徵轉化成演算法可以處理的數值表示,實現特徵抽象.特徵是二值型的, 如sex 這個欄位有male 和fem 兩種,就把sex 抽象成0 和1。如果特徵的數值是多值型, 如status,就按照嚴重程度從0 到1 再到2 來抽象.

2.資料預先處理:數值轉double/歸一化到0 和1 之間 通過“類型轉換組件”先把資料類型全部轉化成 double 型(機器學習演算法普遍對double 型資料的支援比較好),然後通過“歸一化組件” 對資料進行去量綱處理,把全部數值都歸一化到0 和1 之間

3.訓練和評估:   拆分組件”,在組件中資料按照7 : 3 的比例隨機拆分 70%的資料用來訓練模型,30%的資料用來預測。

4。模型評估: 因為本次實驗是一個二分類情境,已經通過“預測組件”拿到了預測 值和真實值的結果,但是我們需要更直觀地驗證實驗是否準確,所以選擇了“二分類評估 組件”對結果進行評估。

新聞文本分析

1。資料預先處理及分詞,增加序號,分詞

2。關鍵詞提取 詞頻統計組件

3。文章分類。“三元組轉KV 組件”是文本向量化的常用演算法,原理是把文本資料 轉成K:V 格式展示,

 

突擊-資料結構與演算法速成

    第一課:從基本資料結構說起,棧,隊列,鏈表的常規應用    

第二課:基本資料結構之————棧,隊列,鏈表的奇淫技巧    

第三課:進階資料結構之————堆,二叉樹的常規應用    

第四課:進階資料結構之————樹的無奇不有的變形    

第五課:進階資料結構之————散列表、搜尋樹    

第六課:必修演算法之————排序    

第七課:必修演算法之————分治    

第八課:必修演算法之————貪心    

第九課:必修演算法之————搜尋    

第十課:圖演算法之————拓撲排序、最小產生樹(Kruskal與Prim)    

第十一課:圖演算法之————單源最短路徑(Dijstra、Bellmanford、SPFA)及其變式使用

業務解決方案/-資料結構與演算法速成

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.