摘要: 什麼是分詞技術? 分詞技術是搜尋引擎針對使用者提交查詢的關鍵串進行的查詢處理後,根據使用者的關鍵字串用各種匹配方法進行的一種技術。 分詞技術最早研究發明的是谷歌,也是最成
什麼是分詞技術? 分詞技術是搜尋引擎針對使用者提交查詢的關鍵串進行的查詢處理後,根據使用者的關鍵字串用各種匹配方法進行的一種技術。 分詞技術最早研究發明的是谷歌,也是最成熟的技術,中文分詞技術大家都很清楚的。 雖然谷歌是分詞技術的創始者,但在中文比之英文要複雜得多,有多種語義,所以中文分詞技術這方面是百度領先。
中文分詞有三種方法:
1.字串匹配的分詞法
2.詞義分詞法
3.統計分詞法。
在這裡就不詳細介紹了,實例為主。 我們以「中文分詞技術」為例,假設它是網頁的關鍵字,如何對它進行分詞來使我們的網頁排名更靠前,讓更多人搜索到。 百度分詞:字串匹配的分詞是「中文分詞技術」,詞義分詞是「中文分詞」、「分詞技術」,統計分詞是「中文」、「分詞」、「技術」。 一個詞百度可以分這麼多個,而我們要提取對網站有用的詞語,百度也會根據詞語的匹配、詞義的匹配、詞語出現的頻率,決定根據那些詞語捕捉網頁。
在百度輸入「中文分詞技術」,排在第一頁上的都是「中文分詞技術」為標題的網頁,除了第一位網站,是「中文分詞」為標題。 可能有人會覺得奇怪,其實不然在標題意思相近,文章的被關注率,網站主題,網站的外鏈及權重就決定了它的排名,當然這不是我們現在探討的。 我們從搜尋結果可以看到,紅色的字體大都為「中文分詞技術」,說明在網站條件相當的情況下,先顯示標題匹配的網頁。 然後在往後看,用百度快照查看網頁,你會發現,「中文分詞技術」、「中文分詞」、「中文」字體為黃色,「分詞技術」、「分詞」為藍色,「技術」為綠色。 百度分別給它們的權重是黃色》藍色》綠色,這樣我們就知道如何選取關鍵字了。 優先選擇「中文分詞技術」、「中文分詞」(「中文」這個詞就不用考慮了,跟我們的文章主題不符),然後再選擇「分詞技術」,雖然「分詞技術」權重稍低,但符合我們文章主題。
通過分詞技術,結合文章主題與線民的搜索習慣,我們可以為自己的網站確定關鍵字,其實這也是seo的由來。 分詞技術是搜尋引擎的核心技術之一,如果你在這方面有研究的話,在提上網站排名方面,就能如魚得水了。
作者:南京seo 原文位址:HTTP://www.seochina1.com 歡迎轉載交流,轉載請保留!