仲介交易 HTTP://www.aliyun.com/zixun/aggregation/6858.html">SEO診斷 淘寶客 雲主機 技術大廳
說實話,雖然做了SEO這麼久,而且之前也讀過盧亮關於網頁信噪比的分析,但我一直沒有對這個問題進行深入的思考,今天拜讀小鵬關於網頁信噪比的文章, 聯想到前段日子也親耳聽胡寶介女士提到過信噪比的概念.所以就特意對這個問題進行了仔細的探討.
關於信噪比的定義,網上廣泛流傳的定義是:指網頁中的文本內容部分與生成這些文本而產生的html標籤內容的比率;小鵬認為應該更廣義的理解是:網頁中的文本以及各種因素(包括圖片,flssh,css等連結 ) 和網頁html標籤內容的比率.
那麼針對上面這兩種定義,我還是認為非常的不恰當,沒有抓住本質的東西.不管是聲學方面對於信噪比的定義還是資料通信領域裡的信噪比,在定義概念的時候,都強調了有用資訊跟干擾資訊之間的比較.比如資料通信領域對於信噪比(S/N) 的定義就是資訊與雜訊之比。 那麼類比到搜尋引擎檢索領域,網頁內容信噪比的定義應該依然是網頁有用資訊跟干擾資訊之比。
以有用資訊跟干擾資訊之比這種定義來看,之前提到的兩種定義,都認為網頁中的文本(或加上其他因素如包括圖片,flssh,css等)成了有用資訊,而產生的html標籤內容減去這些有用資訊的為垃圾資訊。 這顯然太過於牽強。 難道搜尋引擎能識別的文本資訊就一定是有用資訊??? 而之外的其他資訊就是干擾資訊?
所以理解信噪比的關鍵就在於什麼是有用資訊,什麼是干擾資訊。
而對於這一點,我理解的是:搜尋引擎對於其所抓取的內容會有一個基本的判斷,判斷該頁面內容對應的主題及所有可能的關鍵字並將其進行排序。 是否為有用資訊和無用資訊,對於搜尋引擎來說,是針對具體關鍵字而言的。 所以網頁的信噪比跟具體某一關鍵字的信噪比應該有所區分。 具體關鍵字的信噪比是網頁中對該關鍵字檢索有利的資訊和干擾資訊之比。 而網頁的信噪比為該頁面核心關鍵字的信噪比。
網頁中如果存在搜尋引擎認為與某一搜索詞沒有任何相關性的內容(即搜尋引擎無法判斷該段內容與搜索關鍵字之間的關係),那麼這些內容既為該關鍵字的干擾資訊。 這些干擾資訊可能包括flash,圖片,及與關鍵字沒有相關、卻十分冗長的段落文本等。 同理,網頁的干擾資訊即為網頁核心關鍵字的干擾資訊。
對於flash,圖片,js等搜尋引擎不能識別的東西來說,對於任何關鍵字都被列入了干擾資訊。 而且,對於文字內容比較多的網站來說,信噪比跟關鍵字密度的概念比較接近。 至於具體的html的代碼語句符號,我覺得對於搜尋引擎來說,其對於網站排名的影響,更多是影響了網站代碼的合理和正確性,影響了網站的存取速度。 而不是被搜尋引擎列為干擾資訊,影響排名的。 所以,我也可以預言,如果多餘的代碼不是太過分,導致網頁出錯或不符合某些標準或使得網頁檔太大。 對排名的影響幾乎是可以不考慮的。 一般情況下,搜尋引擎都直接忽略了這些代碼符號語句,也從來沒有在哪個搜尋引擎的搜尋結果中看到html裡面的那些語句定義符號出現過。
上面所討論的信噪比概念,體現在具體搜尋引擎優化操作中,就是需重視網頁核心關鍵字的信噪比,而不可能考慮所有可能關鍵字的信噪比。 對於一個比較合理的網站來說,搜尋引擎可以通過網站的Title,Meta等去識別網頁的核心主題,那麼網頁的段落中出現與Title和Meta相呼應的內容就非常重要,這些內容可能會列為有用資訊,那麼其他的一些資訊,雖然也是文本 ,但如果冗長而與標題Meta不相關,就應該果斷捨棄,或使其相關。 不然則直接增加了網站核心關鍵字的信噪比。
還有一個需要注意的是,設計網頁需要考慮如何讓搜尋引擎識別核心關鍵字和主題。 如果搜尋引擎連主題都很難理解,那麼談網頁信噪比也沒有意義。 具體如何讓搜尋引擎識別核心關鍵字和主題,則是另一個話題,擇日再論。 當然本文的想法嘗未經實踐證明,提出來引導大家思考而已。