百度中文分詞技術的一點小猜測

最後更新：2017-02-28 來源：互聯網

上載者：User

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

　　大家都知道，百度的中文分詞技術比GOOGLE做的好，以下引用網路上找到的一張圖片說明：

　　從上圖可以推斷出，百度遇到一個關鍵字，應該是先不進行分詞，而是先檢索百度百科的詞條和百度指數有指數的中文詞進行匹配，無法精確匹配的話，再進行分詞，前兩年在百度搜尋索引鍵“利川新聞網”時，被分為利川/新聞/網，自從這個關鍵字有指數以後，百度會把它當做一個完整的關鍵詞。

　　當然，百度的分詞技術肯定比我個人推斷出來的要複雜的多，作為百度旗下的產品，百度不會放棄自己的資源，肯定會參考百度百科的詞條作為分詞演算法的一部分，所以同樣做搜尋的騰訊搜搜也開發了自己的百科，但是我們以後在做SEO的時候，遇到比較偏的長尾關鍵詞不能被正確分詞的情況下，可以在百度百科建立一個詞條，然後在參考資料裡加上自己的連結，這樣還可以解決百度相關產品權重比我們的網站高的問題。

　　本文由利川線上原創，A5平台首發，轉載請註明出處，本文來源網址：http://www.445400.com/blog/610.html

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More

百度中文分詞技術的一點小猜測

聯繫我們

A Free Trial That Lets You Build Big!

Sales Support

After-Sales Support