&HTTP://www.aliyun.com/zixun/aggregation/37954.html">nbsp; 重複內容始終是一個經常被談論的話題。 我們不斷地發表關於這方面的文章,人們也在不斷地提出問題。 特別是,我還聽到有很多網站管理員擔心自己受到了「重複內容處罰」。
在這裡請允許我們把這個問題一次性跟大家講清楚:根本不存在所謂的「重複內容處罰」。 至少,也不是大多數人談論時所認為的那樣。
有一些處罰是和抄襲其他網站的內容有關的,比如完全抄襲並且發佈其他網站的內容,或者在完全沒有提供任何其他附加價值的情況下發布這些抄襲的內容。 這些都是我們不提倡的做法,您可以在網站管理員指南裡找到有關此問題的清晰的論述:
1、請不要創建含有大量重複內容的多個頁面、子域或者域。
2、請避免使用那種「一個模子印出來」(cookie cutter)的方式創建網站,比如沒有或者很少原創內容的聯屬計畫。
3、如果您的網站參與聯屬計畫,請確保您的網站可提供附加價值。 提供獨特且相關的內容,使使用者首先有理由訪問您的網站。
然而,在某些情況下,為操縱搜尋引擎排名或獲得更多的訪問量,某些網站擁有者會故意在多個域內安插重複內容。 此類行為即屬於欺騙性行為,這會導致非常糟糕的使用者體驗:使用者在一組搜尋結果中會看到大量相同的重複內容。
Google 會儘量使用不同的資訊來編制索引以及顯示網頁。 例如,這種過濾方法表示,如果您網站中的每篇文章都有"常規"和"可列印"兩種版本,並且 robots.txt 或 noindex 元標記都未攔截任何一個版本,那麼,我們會選擇列出其中一種版本。 如果 Google 認定顯示重複內容是為了操縱我們的排名並欺騙我們的使用者,儘管這種情況很少出現,我們也會在將此類網站編入索引和對其進行排名的過程中做出相應的調整。 這樣一來,網站的排名可能會受到影響,或者我們可能會將網站從 Google 索引中完全刪除,網站刪除後將不會再顯示在搜尋結果中。
大部分的網站管理員都已經知道重複內容能給網站的排名帶來負面效應。 但是怎樣才能檢查某個特定的網站是否存在這個問題,並且怎樣才能減少或者避免它呢?
從一開始,可以將重複內容劃分為兩個主要的種類:
網站結構導致的重複內容
內容盜竊導致的重複內容
關於網站結構導致的重複內容
一些網站結構本身會引起重複內容,實例如下所示:
列印友好(ptint-friendly)的頁面
在多個頁面上具有大體相似的內容,而能通過不同的URL位址訪問
頁面上有非常類似的單元,比如在一個電子商務種類中,一連串不同顏色的襯具有相似的描述
頁面是一個追蹤應用程式的會員程式的一部分,且這個程式配置不正確
多個頁面有重複的標題或重複的meta標籤值
在URL位址中使用會話ID
標準化問題
為了查找網站結構導致的重複內容,可以使用site:www.yingyuxuexi.org.cn查詢串來檢查已被搜尋引擎索引過的網站的URL位址。 所有主要的搜尋引擎(Google,Yahoo!,Microsoft Live Search)都支援這個功能。 通常,「列印友好」的頁面如果被索引的話,就會很快顯示出來。