仲介交易 HTTP://www.aliyun.com/zixun/aggregation/6858.html">SEO診斷 淘寶客 雲主機 技術大廳
複製網頁(或者叫重複內容網頁)指的是兩個或多個網頁內容相同,或非常相似。
一般來說,搜尋引擎不喜歡複製內容網頁,他們會儘量判斷哪一個是原始版本,然後把其他的複製網頁忽略不計。
有兩點值得注意:
1)複製網頁的判斷並沒有一個比例。 比如說一個網頁上有60%或80%的內容和其他網頁相同,就被列為複製網頁,如果真有一個比例那就簡單多了。
2)複製網頁並不會帶來懲罰。 搜尋引擎會丟掉其他的複製網頁,但不會懲罰搜尋引擎認為的原始出處。
不過這就有可能對真正原始出處產生懲罰。 比如搜尋引擎判斷錯誤,把原始出處當成複製的,而把複製的當成原始出處。
複製內容網頁的出現一般有這些可能性:
1)網址正常化問題所產生的。
2)代理商和零售商的網站經常從產品生產商的網站上抄下產品資訊。 這倒沒什麼不對,一般產品生產商也都同意,但是絕大部分代理商,零售商,批發商都會直接copy,而不做改動。 所以這些電子商務網站上充斥著大量複製內容網頁。
3)列印版本。 很多網站提供更適於列印的版本,如果沒有用robots.txt檔,那麼這些列印版本網頁就可能會變成複製網頁。
4)網頁內容由RSS生成。 有很多網站,尤其是新聞類網站,都是用其他網站的RSS feed來生成網站內容的,這些內容在原始出處和很多其他網站上都已經出現了。
5)電子商務網站使用Session ID。 搜尋引擎蜘蛛在不同時間訪問網頁的時候,被給了不同的Session ID,但實際上網頁內容是一樣的。 不過由於Session ID的參數不同,就被當成了不同的網頁。
6)網頁實質內容太少。 每個網頁上都不可避免的有通用的部分,比如導航條,版權聲明等等。 如果網頁的正文部分太少,數量還抵不上這些通用部分,就有可能被認為是複製內容網頁。
7)文章抄襲轉載等。 有的時候是其他人抄襲了你的網站內容,有的時候是善意的轉載,有的時候是作者自願的向不同的網站發送文章,這些都有可能造成複製內容網頁。
8)鏡象網站。 鏡象網站曾經很流行,當一個網站太忙太慢的時候,使用者可以通過替代鏡象來看內容或下載,這也有造成複製內容網頁的風險。
9)產品或服務類型之間區別比較小。 比如有的網站把自己的產品或服務按地區進行分類,但實際上提供給每個地區的產品或服務都是一樣的。 在這些按地區分類的網頁上,只是把地名改了改,其他內容全都一樣。