昨天談到統計數字在SEO中的局限,其實這牽扯到另外一個問題,也就是SEO實驗的可行性和可信度。
相信無數的人都在試圖通過實驗來解讀搜尋引擎演算法。 這有個專門的詞,逆向工程,reverse engineering,也就是在可控條件下,通過改變網頁某些參數,然後觀察搜尋引擎排名中的變化,達到理解搜尋引擎排名演算法的過程。
這些逆向工程和SEO實驗,很多高手和大公司都在不停的做著,有的也很有成果。 可是說到底,這種實驗資料是不能HTTP://www.aliyun.com/zixun/aggregation/34182.html">百分之百可靠的。
這就像解數學題:AxB=C。 當我們知道結果C(也就是搜尋引擎排名)和A或B中一個資料時,我們能計算出A或B中另外一個數。 但是當我們對A和B中兩個數都不知道時,只能列出一堆可能性,卻不可能得到唯一的AB數值答案。
更何況搜尋引擎演算法考慮的不是兩個數值,而是一兩百個參數。 而我們這些外人對這一兩百個參數可以說一個都不確切知道。 所以想通過反向工程推論出這些參數是怎麼設置的? 在排名演算法中佔有的比重? 理論上是不可能的。
舉個簡單例子,假設我們想實驗關鍵字密度是3%好還是5%好。 一個可以設想的實驗模型是,用兩個同時註冊的功能變數名稱,放上相同長度的文章內容,其中一個目標關鍵字密度3%,另一個密度5%,在同一個網頁上放上這兩個新功能變數名稱的連結。 等收錄後查詢目標關鍵字,看哪個網頁排的靠前。 這關鍵字的選擇最好是很冷門生僻的詞,甚至是唯一的詞,在其他網頁上沒出現過。
可是這樣一個看似還算合理的模型,卻忽略了很多可能影響試驗結果的因素。 比如,同一個網頁上放兩個連結,必然有前有後,這兩個連結的權重會不會不同? 新功能變數名稱收錄時間會不會造成不同? 而收錄時間又會不會造成功能變數名稱權重不同及排名不同?
一旦網頁上出現這兩個功能變數名稱的連結,怎麼保證沒有其他人,其他任何地方出現這兩個功能變數名稱的連結? 因為一旦出現,實驗者就不能保證這兩個功能變數名稱的連結數目和權重完全一樣。
另外,這兩個新功能變數名稱網頁內容要不要是一樣的內容? 還是不同的內容? 如果是一樣,或者是大部分一樣的內容,是不是會造成複製內容網頁? 而對複製內容,搜尋引擎將選擇其一為原創,另外一個為複製。 在其他條件完全相同時,這個選擇是不是是隨機的? 如果內容放不一樣,由語義分析帶來的微妙差別怎樣計算?
這種種因素其實都很難控制,會對實驗結果造成什麼影響很難講。 嚴格來說,要在完全受控條件下進行SEO實驗,是我們這些做網站的人辦不到的。 SEO實驗結果有時有很高的參考意義,有時也很誤導。
作者: Zac@SEO每天一貼
原載: 中新虛擬主機