標籤:
資源推薦
Zac出版的《SEO實戰密碼》是SEO入門的好書,可惜我在噹噹網買的電子書受DRM著作權保護,無法與大家分享。
我在網上找到了此書的 瞭解搜尋引擎 章節,非常詳細,且容易理解。連結如下:
http://www.21jn.net/seo/zac/zac.html
前言
SEO由英文Search Engine Optimization縮寫而來,中文意譯為“搜尋引擎最佳化”。SEO是指從自然搜尋結果獲得網站流量的技術和過程,是在瞭解搜尋引擎自然排名機制的基礎上,對網站進行內部及外部的調整最佳化,改進網站在搜尋引擎中的關鍵詞自然排名,獲得更多流量。部落格SEO的目的,就是要提升部落格的訪問量和人氣。
要想做好SEO,就必須簡單瞭解搜尋引擎工作原理以及自然排名機制。
搜尋引擎工作過程非常複雜,我這裡只簡單介紹搜尋引擎是怎樣實現網頁排名的,並且我只是針對註冊類部落格的SEO需要瞭解的知識。本文章介紹的內容相對於真正的搜尋引擎技術,來說只是皮毛,不過對部落格的SEO已經足夠用了。我盡量最容易理解的方式,並且不設計到演算法和深奧的理論知識。
搜尋引擎的工作過程大體上可以分成三個階段:爬行和抓取、預先處理、返回搜尋結果。
一、爬行和抓取
搜尋引擎蜘蛛通過跟蹤連結訪問網頁,獲得頁面HTML代碼存入資料庫。
搜尋引擎蜘蛛是怎樣抓取網頁的呢?
發現某一個連結 → 下載這一個網頁 → 加入到臨時庫 → 提取網頁中的連結 → 在下載網頁 → 迴圈。
首先搜尋引擎的蜘蛛需要去發現連結,至於怎麼發現就簡單了,就是通過連結發現連結。其方式有深度優先和廣度優先。當然我們註冊的部落格基本不考慮網站目錄結構的問題。通常網站結構通常分為以下三個層次:首頁——頻道——文章頁。理想的網站結構應該是更扁平一些,從首頁到內容頁的層次盡量少,這樣搜尋引擎處理起來,會更簡單。
對於部落格SEO,要想讓蜘蛛抓取我們的文章,就必須為文章匯入連結。無論是外部連結還是同一個部落格的內部連結,都可以增大蜘蛛發現網頁並爬行的機率。否則蜘蛛根本沒有機會知道頁面的存在。
比如:我寫系列部落格喜歡把相關文章的串連寫在博文裡,雖然開始我的文章沒有一篇被百度收錄。一天,有一篇文章上了http協議分析工具上了部落格園-原創精華區,因為其頁面權重高,百度蜘蛛抓取也就越頻繁。隨著這一篇博文的收錄,我的所有博文就都被百度收錄了。
二、預先處理
索引程式對抓取來的頁面資料主要進行關鍵詞提取、產生倒排索引、頁面PageRank值計算、關鍵詞與頁面相關性、TrustRank值計算等處理,以備排名程式調用。這是搜尋引擎能在極短時間內返回搜尋結果的關鍵。其中我們最關心的是PR值和相關性。
PageRank原理
瞭解PageRank也就是理解為什麼SEO要求一定數量高品質的外鏈。
PageRank可以形象的比喻成:一個頁面的排名是由連結來"投票"的結果,並且是權重不等的投票,優秀的網站為你投的一票會為你的排名更靠前,垃圾網站就沒啥用。因此高品質的外鏈是對SEO是很有協助的。
經過頁面PageRank值計算之後,網頁會得到一個與頁面主題(內容)無關的排名。
PageRank值決定因數:(來自維基百科)
PageRank works by counting the number and quality of links to a page to determine a rough estimate of how important the website is. The underlying assumption is that more important websites are likely to receive more links from other websites。
上面這段話的大意是:PR值是通過指向該頁面連結的數量和品質來決定。
連結的品質怎麼理解?
假設一個網頁PR值較高(重要性高),那麼出現在該網頁內的串連品質就比較好。通常一些權威網站PR值較高。
這也就意味著網頁之間的重要性會傳遞。一個連結傳遞的PR值決定於匯入連結所在頁面的PR值,發出連結的頁面本身PR值越高,所能傳遞出去的PR也越高。
關鍵詞與頁面的相關性
瞭解相關鍵詞與頁面的相關性就是要理解為什麼SEO要求做好文章的錨文本以及關鍵字最佳化。
影響頁面與搜尋關鍵詞相關性的因素有連結分析、詞頻及密度、關鍵詞位置及形式、關鍵詞距離等因素,其中連結分析佔了相當大的比重。
不得不提的是百度創始人李彥宏的超鏈分析專利。
建立一個連結詞庫,記錄連結錨文字的一些相關資訊,如錨文字中包含哪些關鍵詞,發出連結的頁面索引,包含特定錨文字的連結總數,包含特定關鍵詞的連結都指向哪些頁面。詞庫不僅包含關鍵詞原型,也包含同一個詞乾的其他衍生關鍵詞。
根據這些連結資料,尤其是錨文字,計算出基於連結的網頁的相關性。在使用者搜尋時,將得到的基於連結的相關性與基於關鍵詞匹配的傳統相關性綜合使用,得到更準確的排名。
頁面有越多以搜尋字詞為錨文字的匯入連結(這句話得仔細體會),說明頁面的相關性越強。連結分析還包括了連結源頁面本身的主題、錨文字周圍的文字等,比如一個服裝類的網站有指向java語言學習頁面的串連,那麼這個頁面和搜尋關鍵詞的相關性就低。
三、返回搜尋結果
使用者輸入關鍵詞後,排名程式調用索引庫資料,匹配關鍵詞,然後按一定格式生搜尋結果頁面。這是因為前面的預先處理,搜尋引擎能在極短時間內返回結果。
百度搜尋結果顯示格式
自然結果格式解析
百度自然界結果的一條記錄格式如下:
第一行是頁面標題,通常取自頁面HTML代碼中的標題標籤(Title Tag)。這是結果清單中最醒目的部分,使用者點擊標題就可以訪問對應的網頁。所以頁面標題標籤的寫法,無論對排名還是點擊率都有重要意義。
第二、三行是頁面說明。頁面說明有的時候取自頁面HTML中的說明標籤(DescriptionTag),有的時候是從頁面可見文字中動態抓取相關內容。所以顯示什麼頁面解說文字是使用者查詢時才決定的。
第四行是百度快照和百度口碑的好評率,注意這個好評率是整個網站的好評率,而不是單個網頁。
部落格SEO-搜尋引擎工作原理簡介