複製網頁是怎樣形成的?

來源:互聯網
上載者:User
關鍵字 複製 怎樣 這些

仲介交易 HTTP://www.aliyun.com/zixun/aggregation/6858.html">SEO診斷 淘寶客 雲主機 技術大廳

複製網頁(或者叫重複內容網頁)指的是兩個或多個網頁內容相同,或非常相似。

一般來說,搜尋引擎不喜歡複製內容網頁,他們會儘量判斷哪一個是原始版本,然後把其他的複製網頁忽略不計。

有兩點值得注意:

1)複製網頁的判斷並沒有一個比例。 比如說一個網頁上有60%或80%的內容和其他網頁相同,就被列為複製網頁,如果真有一個比例那就簡單多了。

2)複製網頁並不會帶來懲罰。 搜尋引擎會丟掉其他的複製網頁,但不會懲罰搜尋引擎認為的原始出處。

不過這就有可能對真正原始出處產生懲罰。 比如搜尋引擎判斷錯誤,把原始出處當成複製的,而把複製的當成原始出處。

複製內容網頁的出現一般有這些可能性:

1)網址正常化問題所產生的。

2)代理商和零售商的網站經常從產品生產商的網站上抄下產品資訊。 這倒沒什麼不對,一般產品生產商也都同意,但是絕大部分代理商,零售商,批發商都會直接copy,而不做改動。 所以這些電子商務網站上充斥著大量複製內容網頁。

3)列印版本。 很多網站提供更適於列印的版本,如果沒有用robots.txt檔,那麼這些列印版本網頁就可能會變成複製網頁。

4)網頁內容由RSS生成。 有很多網站,尤其是新聞類網站,都是用其他網站的RSS feed來生成網站內容的,這些內容在原始出處和很多其他網站上都已經出現了。

5)電子商務網站使用Session ID。 搜尋引擎蜘蛛在不同時間訪問網頁的時候,被給了不同的Session ID,但實際上網頁內容是一樣的。 不過由於Session ID的參數不同,就被當成了不同的網頁。

6)網頁實質內容太少。 每個網頁上都不可避免的有通用的部分,比如導航條,版權聲明等等。 如果網頁的正文部分太少,數量還抵不上這些通用部分,就有可能被認為是複製內容網頁。

7)文章抄襲轉載等。 有的時候是其他人抄襲了你的網站內容,有的時候是善意的轉載,有的時候是作者自願的向不同的網站發送文章,這些都有可能造成複製內容網頁。

8)鏡象網站。 鏡象網站曾經很流行,當一個網站太忙太慢的時候,使用者可以通過替代鏡象來看內容或下載,這也有造成複製內容網頁的風險。

9)產品或服務類型之間區別比較小。 比如有的網站把自己的產品或服務按地區進行分類,但實際上提供給每個地區的產品或服務都是一樣的。 在這些按地區分類的網頁上,只是把地名改了改,其他內容全都一樣。

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.