2015阿里天池大資料競賽-Solution

來源:互聯網
上載者:User

標籤:阿里資料採礦競賽   機器學習   

競賽介紹:連結

這篇文章記錄2015阿里天池大資料競賽中,我的一些代碼,由於目前還在比賽中,僅分享一個naive solution,基於規則,代碼首頁在我的github上:連結,下面是代碼說明。有興趣的請看代碼注釋,恕不詳述。

本repo目錄說明
  • data 存放資料
  • preprocess 資料預先處理
  • rule 根據規則產生提交檔案
  • model 訓練機器學習模型(暫時不分享)
代碼使用說明
  • fork本repo,非Github使用者請點右下角的Downlown ZIP

  • 解壓後,將tianchi_mobile_recommend_train_user.csv以及tianchi_mobile_recommend_train_item.csv放入/data/目錄下

  • 僅需兩個步驟即可獲得一份提交檔案,F1可達到7.6%

    • 第一步,進入/preprocess/目錄,運行data_preprocess.py
    • 第二步,進入/rule/目錄,運行gen_submission_by_rule.py
  • 完成上面兩個步驟後,在/rule/目錄下會產生一份tianchi_mobile_recommendation_predict.csv檔案,提交它。

補充說明
  • 純Python,無任何依賴項。

  • 關於代碼實現的功能,在每份代碼檔案中均有注釋,代碼可能寫得比較亂,也可能有bug,歡迎issues。

  • 如果你想獲得更高的F1值,修改gen_submission_by_rule.py這份檔案,加入一些規則,F1可以達到9%以上

  • 建議在Linux下運行;在我的PC上(8核),上面兩個步驟總共花了不到20分鐘。

  • 請在規則的基礎上,做特徵工程,訓練模型,這才是參賽目的。

  • 進入第二賽季後,請刪了這些代碼,不適合處理大資料。

2015阿里天池大資料競賽-Solution

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.