仲介交易 HTTP://www.aliyun.com/zixun/aggregation/6858.html">SEO診斷 淘寶客 雲主機 技術大廳
搜尋引擎是一個資訊平臺,它本身並不提供資訊,李彥宏最近推出的框計算理論和百度開放平臺都更好的解釋了一點。 作為一個搜尋引擎優化師,我們必須理解搜尋引擎的後臺關鍵字查詢的原理。
我們把某個關鍵字提交到搜尋引擎框的時候,中文的搜尋引擎必須通過分詞技術得到使用者需要的資訊,並回饋給使用者。 這篇文章,JOHN帶領大家瞭解這個關鍵字查詢過程和原理。 在查詢的時候,一般我們分四種情況:
一、搜尋引擎後臺根據分隔符號或分詞詞典來進行密切的切分
使用者在搜尋引擎敲入關鍵字並按回車後,搜尋引擎後臺首先判斷這個詞中是否有空格、標點符號等,如果有,搜尋引擎會把這個關鍵字再一次的分解成幾個小的關鍵字進行分析,如果沒有分隔符號則按照後臺的分詞詞典進行關鍵字切分。
我來舉個例子,比如我們在百度搜索「寧波 SEO」,點擊排名第一的網站快照,百度會在快照把兩個詞用不同顏色標注出來,如「寧波」是黃色,「SEO」是淡藍色,如下圖:
寧波SEO
這個實例就告訴我們,我們在搜索「寧波 SEO」的時候,百度把它分解成了「寧波」和「SEO」拿來查詢。 中間如果是「,」查詢的結果其實是一樣的。 這就是為什麼在寫超過兩個關鍵字的時候建議大家用半形英文逗號來分割,這樣就是能避免搜索殷勤進行重複解析。 中文的分詞技術相對與其他語言要難的多,因為它是不分詞沒有空格的,不像英文每個單詞都有空格,這就給搜尋引擎帶來非常大的困難,完全沒有我們想像的簡單。 目前在中文分詞技術上,百度還是優於谷歌的。
二、當出現重複詞搜尋引擎是怎麼處理的
比如你在搜索「寧波 seo seo」和「寧波 seo」的結果是一樣的。 這說明在百度出現重複詞的情況下,會直接捨棄,保留一個,所以出現的結果都是一樣的。 但是谷歌不同,搜索這兩個片語的排名是不同的,說明谷歌在這個方面加強了運算參數。
如果你在百度查詢「seo 寧波 seo」和「寧波 seo」,得出的結果也是一樣的,這也說明百度直接忽略前後關係。 但是在谷歌的搜尋結果中就不同,說明谷歌引入了前後關係參數。
三、當搜索英文詞的時候搜尋引擎怎麼處理
當使用者輸入英文詞的時候,這個英文詞會貝當作一個詞來切分,然後以這個英文詞為界,再分前後的次級關鍵字。 比如你在搜索「蘋果MAC系統」的時候,搜尋引擎會把他們切分成「蘋果」「MAC」「系統」三個詞,並且會把MAC當做一個重要詞保留,不管這個詞在這個片語中語法怎樣。
四、搜尋引擎會的查詢擴展處理會提高資訊檢索的召回率
搜尋引擎會根據使用者搜索的關鍵字來判斷潛意詞和同意詞。 比如,你搜索「爸爸」和「媽媽」,」WEB」和「互聯網」,「和諧」和「社會」,搜尋引擎將會當做同義字來處理。 另外,搜尋引擎在檢索的時候,還會根據主題來歸類,比如你搜索「寧波網站建設」,網站設計也會顯示紅色,如圖:
寧波網站建設
總的來說,百度在中文的分詞技術上比谷歌更勝一籌。