樸素貝葉斯演算法在垃圾郵件過濾中的應用,貝葉斯垃圾郵件

來源:互聯網
上載者:User

樸素貝葉斯演算法在垃圾郵件過濾中的應用,貝葉斯垃圾郵件

由於最近在寫一篇關於大資料分類的論文(吐槽一下:導師天天催),所以在圖書館借了幾本有關大資料的書籍。今天看《New Internet 大資料採礦》(感興趣的可以看一下)中提到垃圾郵件過濾,讓我聯想到昨天在1280社區看到一道名企面試題,“在遊戲即時交流中,怎麼過濾那些廣告?”。當時想到的是關鍵詞過濾,也沒細想。

其實垃圾郵件過濾跟廣告過濾是一種,使用最多的是樸素貝葉斯演算法。

貝葉斯定理是關於隨機事件A和B的條件機率(或邊緣機率)的一則定理。

(參見維基百科http://zh.wikipedia.org/wiki/%E8%B4%9D%E5%8F%B6%E6%96%AF%E5%AE%9A%E7%90%86)


通過對大量已經判定的垃圾郵件和正常郵件進行學習,根據兩種郵件中相同詞語出現的機率對比來確定垃圾郵件的可能性。優點是準確率高,缺點是需要大量的曆史資料。



樸素貝葉斯演算法問題

用這個來編軟體 ? 我給你的提示,也是我現在在做的畢業設計,你用excel來實現你的計算,這個要比軟體來的方便,然後你在利用VB和你製作的excel進行互動。 生活中的具體應用不多
 
我正在使用樸素貝葉斯演算法實現資訊過濾,需要訓練集,希望有人可以提供以下

今天都6月4號了,沒人回答你,LZ不如把分給我好了~
 

相關文章

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.