仲介交易 HTTP://www.aliyun.com/zixun/aggregation/6858.html">SEO診斷 淘寶客 雲主機 技術大廳
搜尋引擎其實也是WEB2.0的典範,因為需要處理使用者輸入了資料,所以能很好和使用者產生交互。 但對於搜尋引擎而言,並不會把使用者輸入的所有詞語都直接用於排名,而是首先會經過自己的處理,這次處理之後的詞語才能直接使用者排名。 本文根據自己的總結和大家分享搜尋引擎是如何處理我們輸入的搜索詞。 如果不對的地方,也歡迎大家指正。
第一、首先分詞:分詞是一大特色,無論我們輸入的是長句子或者是短語,搜尋引擎都會把這些詞語進行切分,將這些搜索的字串切分成以詞為基礎的關鍵字組合。 只要這樣,才能更好的通過自己已經預處理後的資料庫進行查詢和比對,把所有符合這些詞的也沒列舉返回給使用者。 這個分詞和頁面分詞的原理有些類似。
第二、去停止詞:我們在搜索時候帶有很多的主觀性,很多時候把口語話的一些詞語都用在了搜索詞上,但這次詞往往對要搜索的內容沒有實質性的説明,但我們已經養成了輸入這些詞的習慣,所以搜尋引擎必須要能去停止詞, 最大程度上保證搜索的準確率以及相關性。
第三、指令的處理:平時我們在搜索時會輸入多個詞語,其實預設的情況下,搜尋引擎把多個預設的詞語都按照「與」來進行詞語。 比如你搜索「減肥」「網站」時,搜尋引擎會預設我們輸入的「減肥網站」來進行處理,單獨包含「減肥」或者「網站」的內容理論上將不會返回,但實際情況往往也會出現單獨包含一個詞語的網站。 另外,還要處理各種高級搜索指令的詞語,比如加號減號等。
第四、錯誤矯正:很多時候我們輸入都會存在錯誤的問題,拼音本來諧音就比較多,輸錯也實屬正常,但如果搜尋引擎不進行糾錯的話,就會返回很多我們不希望看到的結果。 所以,有時候我們即使輸入的全拼,搜尋引擎也會根據這個來提示正確的中文。
第五、分類對待:不同詞語一般是不同對待的,這是搜尋引擎的一個特色功能。 比如我們搜索一般性的關鍵字,返回的一般以網頁居多,而當我們搜索一個明星的名字,則會出現很多新聞、視頻、圖片等綜合的搜尋結果。 所以,搜尋引擎要根據使用者的需求去進行判斷。 這次判斷都是在預處理階段進行的。
好了,搜尋引擎對於搜索詞的處理基本是從這五個方面進行,在這裡給大家做個總結:分詞、去停止詞、指令的處理、錯誤矯正、分類對待。 雖然這個對於我們做網站沒有直接的關係,但多瞭解一些基礎知識相信會有間接的作用。 網站,使用者,搜尋引擎本來三個就是一體的,這三個組成了整個互聯網。 很多道理也是想通的,知道了這些簡單的知識,有可能會引發我們其它方面的一些思考和啟示。
本文就到這裡,以後會繼續與大家分享其它方面的知識,歡迎和11544.html">我聯繫,本文來自:牛牛小遊戲,網址:HTTP://www.niuniuxiaoyouxi.com/,也歡迎轉載,轉載請保留版權。