收錄率(inclusion ratio)網站的網頁貯存在搜索索引庫中的百分比,用搜尋引擎發現的網頁除以全部網頁數量。 例如,在baidu報告中你有1000個網頁被加入索引庫,並且你的內容管理系統有2000個頁面在裡面,那麼你在baidu搜尋引擎的收錄率是1000/2000=0.5或50%。
搜尋引擎(search engine)是指根據一定的策略、運用特定的電腦程式搜集互聯網上的資訊,在對資訊進行組織和處理後,為使用者提供檢索服務的系統。 從消費者的角度看,搜尋引擎提供一個包含搜索框的頁面,在搜索框輸入詞語,通過瀏覽器提交給搜尋引擎後,搜尋引擎就會返回跟使用者輸入的內容相關的資訊清單。
互聯網發展早期,以雅虎為代表的網站分類目錄查詢非常流行。 網站分類目錄由人工整理維護,精選互聯網上的優秀網站,並簡要描述,分類放置到不同目錄下。 使用者查詢時,通過一層層的點擊來查找自己想找的網站。 也有人把這種基於目錄的檢索服務網站稱為搜尋引擎,但從嚴格意義上講,它並不是搜尋引擎。
要想使自己的站有一個好的收錄結果,我們還必須先瞭解搜尋引擎的收錄習慣。 只有瞭解它的習性才更有利於自身有利發揮,關於收錄我們先說下Google的收錄習慣。 Google收錄有以下特點:
首先,Google對新站或較新鮮度的東西都比較敏感,有很高的查知性。 它會通過外部連結很快查看到你的網站,通常通過外部連結的收錄率多少,給予一個站的評價高低,如果發現新網站擊或收錄率高那麼自然收錄速度也很快。
另外,Google 使用 PageRank 技術檢查整個網路連結結構,並確定哪些網頁重要性最高。 然後進行超文字匹配分析,以確定哪些網頁與正在執行的特定搜索相關。 在綜合考慮整體重要性以及與特定查詢的相關性之後,Google 才將最相關最可靠的搜尋結果放在首位。 這也是Google收錄網頁的特點之一。
特點二,Google會將連結的文字描述作為關鍵字加以索引,所以我們在作友情連結時千萬要仔細設計連結的文字描述,使之既符合網站的定位又不失相關性,以此博得Google的信任。
特點三,Google 漫遊器會定期抓取 Web,將大量網頁列入索引。 稍後完成的下一次抓取會注意到新網站、對現有網站的更改以及失效的連結,並對內容的變化在搜尋結果中加以調整。
那麼,百度搜尋引擎收錄習慣,它較重視第一次收錄印象,根據第一次印象做為網站重要與非重要衡量指標。 相對Google而言,百度搜尋引擎的人為參與度較高,也就是說在某些層面上可能由人來決定是否收錄網頁而不是由機器來決定。 所以,網站在登錄百度搜尋引擎之前最好把內容做得豐富點、原創內容多一點、網頁關鍵字與內容的相關度高一點,這樣才能給百度較好的初次印象。
百度對網頁的更新相對Google而言更加敏感,可能這與百度的本土性格有關。 百度搜尋引擎每週更新,網頁視重要性有不同的更新率,頻率在幾天至一月之間。 所以在百度的搜尋結果中基本上都標明瞭收錄時間。
看了以上針對百度與Google的收錄習慣,以後大家在優化過程中會更有針對性,在內容方面盡可多些原創,有時候原創會比你刻意增加關鍵字更有收錄效果。