搜尋引擎抓取網頁需要一個複雜的過程,給出排名同樣如此。在經過爬行和抓取、建立索引、存檔、計算頁面相關性之後,還需要最後的幾個環節才能最終完成一個網頁的排名,今天就和大家分享這幾個大家平時可能都不太瞭解的細節,希望共同進步。
首先是排名的過濾與調整,當搜尋引擎進行過匹配子集之後,其實大體的排名基本已經確定了。但還不是完全確定,還需要一些簡單的過濾演算法,對排名進行輕微調整,過濾中最重要的就是懲罰,一些站長無論是採用哪種作弊手法,一旦被搜尋引擎檢測出來的話就會給予處罰,雖然按照頁面的相關性本來應該有好的排名,但是卻有可能給予比較靠後的排名,最重要的就是11位排名和Google的負六、負30等演算法。所以站長在做站的時候不要作弊,如果你想長期做一個好站,那麼請堅持自己的路,不要試圖挑戰搜尋引擎的能力。以前很多網站都是採用站群的方法來最佳化網站,但後來很多排名都無影無蹤的消失了。
其次是動態產生頁面摘要:個別時候我們發現自己的網站顯示的並不是自己制定的描述資訊,而是搜尋引擎從自己網頁中動態抓取的,我們不要驚訝,這個是正常的。特別對於Google而言,這種現象經常發生。很多站長在開始的時候不瞭解這種現象,以為是自己的網站設定或者最佳化出了問題,看到顯示不同步之後,就會到處發帖詢問或者是修改描述,其實大可不必。這是良好的表現,說明搜尋引擎想通過更多的方式去展現你的網站。
再者是搜尋緩衝的使用:使用者的數量是巨大的,搜尋的詞數量也是驚人的,但是很多使用者可能搜的的詞差異不會太大,有的甚至完全相同。根據統計,基本上20% 的詞是最熱門的搜尋字詞,佔到總搜尋量的80%,尤其對於新聞事件或者熱點新聞出現時,搜尋字詞的重複率更是佔了更多,所以搜尋引擎不會每次都從資料庫中重新檢索,這樣就會降低效率也是很大的浪費,所以搜尋引擎會把最常見的搜尋字詞存入緩衝,當使用者搜尋時直接調用。這點對於我們具體建站或者最佳化網站的意義不是太大,給大家分享只是讓大家起到一個瞭解性的作用。
最後使用者的行為會被記錄:這點是本文的一個重點,我感覺也是未來的一個方向。隨著互連網的發展,以後搜尋引擎會越來越智能化,去主動判斷使用者的搜尋意圖,從而給使用者提供一個更加準確的搜尋結果。不同的使用者搜尋同樣一個關鍵詞,想要找的結果有可能不同,所以搜尋引擎會記錄使用者搜尋的行為,包括使用者的IP地址、搜尋的關鍵詞以及時間,還會記錄使用者點擊查看了那些頁面,這些都會記錄形成日誌。這些記錄檔中的資料對於搜尋引擎判斷使用者的搜尋結果以及調整演算法都很有指導意義。做為站長,給我們的提示就是要學會分析自己IIS日誌以及站長統計的資料,我們應該向搜尋引擎學習,通過這些統計為以後的建站最佳化提供指導意義,可以根據即時的資料進行調整。
上邊幾點是我最近從互連網上學習到的一些細節,然後結果自己的經驗給大家做總結分享,可能搜尋引擎層面上的東西對我們沒有直接的關係,怎麼調整、怎麼返回排名更多是搜尋引擎的事情,但我始終認為想要學好SEO就要先瞭解它的一些基本原理,包括預先處理、索引、爬取和收錄等,這些方面可能在實際中會更加複雜,也不需要我們過多深入研究其中的技術痛點,只需要大致把握就行。
好了,本文就到這裡吧,以後會從連結原理上和大家做出總結和分享,大家有好的想法也歡迎和我交流,本文來自:北京SEO,網址:http://www.seostudy.org/,也歡迎轉載,轉載請保留著作權,謝謝!