仲介交易 HTTP://www.aliyun.com/zixun/aggregation/6858.html">SEO診斷 淘寶客 雲主機 技術大廳
筆者于6月25日發表了一篇《巧用301重定向將404錯誤轉化為網站外鏈》的文章,談了一下如何通過301重定向的方式,將從外部得到錯誤URL轉化為可訪問的URL,從而達到傳遞權重的文章。
今天在A5看到了一篇《淺談利用301重定向將404頁面轉移成自己外鏈的危害》,反駁了我之前那篇文章中的觀點。 我覺得非常好,SEO行業正應該有這種質疑的精神和獨立思考的能力。 仔細拜讀了文章,發現作者誤解了我的意思。 所以再寫一篇文章澄清一下其中的觀點,以及介紹一下301重定向的作用。 首先我明確兩個在《使用301重定向將404錯誤轉化為網站外鏈》一文中的思路:
文章所講述的是將404錯誤URL,通過301重定向回到原文的URL。 這點需要說明,我沒有在文章提到任何301到首頁或者其他頁面的意思,文章中的例子,講述的是從外部(B網站)鏈入自身網站(A網站),在過程中有可能出現的URL錯誤拼寫、連結添加錯誤甚至故意產生錯誤URL的行為。 而不是A網站自身出現的404錯誤。
原文一直在那裡,有質疑的朋友可以再仔細閱讀一下。 以下我再反駁一下這位朋友的觀點(藍字是有反駁意見朋友的觀點):
反駁第一段
原作者,將外鏈指向中的404錯誤歸結於是網站外部造成的,這句話無可厚非,但是這種404錯誤的出現,也是由於自己網站程式所決定的,既然出現了就沒有辦法逃避,就比如在A5上頁面也可以出現很多個這樣活著那樣的尾碼404頁面, 直接在後面加入1.html,2.html,就可以了,如此而已,但是如果有人處心積慮的用外鏈的形式來進行連結這樣的網頁,那也是為網站帶來連結,如此而已,頂多產生一個404頁面,而不會有其他。
網站出現404錯誤,不一定是網站內部程式的問題。 蜘蛛通過外部網站(以B網站為例)一個錯誤的URL爬行到自身網站(以A網站為例),同樣會造成404錯誤,即:錯誤的URL導致了錯誤的頁面。 蜘蛛是不會管你連結URL存在於網站內部還是外部,只要在順著URL爬行的過程中出現了「頁面不存在」的情況,就會記錄一個404錯誤。
這點我們在谷歌管理員工具的「運行狀況」 — 「抓取錯誤」 – 「找不到」 一欄中可以明確的看到。 404錯誤被谷歌分為「在sitemap中」 (內因)和 「連結到您網站網頁的域」 (外因)兩項。
顧名思義,其中「連結到您網站網頁的域」是指從B網站連結到A網站的URL。
反駁第二段
而原作者的意思是如何把握這一方面的權重,想要將這種外鏈的權重直接倒回去,而不是放掉,這裡呢,筆者也有自己的觀點,本身這種外鏈「HTTP://www.xxxxx.com/rich-snippets.htmlGFQ」, 這種外鏈所連結過來的就是404頁面,如果你將這些頁面301掉,這種情況就和網站中出現大量的404頁面,然後直接將404頁面301到一個頁面的情況是一樣的;那麼如果你的網站有404頁面,那麼為了防止這些權重的流失, 難道將這些頁面全部301到首頁?這完全就是不符合搜尋引擎的要求,如果想知道清楚的話,就直接百度一下「404頁面301到首頁的危害就」就可以明白更多。
首先,對於「自身行為」還是「外部行為」,顯然搜尋引擎有著明確的區分。 拿連結建設來說,內鏈和外鏈在權重方面的效果是不同的。 這點大家都很清楚。 其核心思想就是外鏈是網站站長無法控制的,而內鏈是站長可以自行設置的。 雖然在搜尋引擎的發展過程中,出現「可被站長控制的外鏈」這一因素(就是平常的外鏈建設)。 但無論可控還是不可控,有一個思想是明確的,即誰也不會在別人的網站可以發佈正確URL的前提下,卻去發錯誤的URL,導致使用者無法正常訪問自己的網站或在自己的網站上出現「該網頁不存在」的字眼。
其次,對於301到原網頁還是301到首頁。 這點我不想多說,大家都原文就可以明白我的意思。 我這裡想說的是搜尋引擎如何甄別原文的出處的一些信號:
搜尋引擎最先在哪裡看到內容
諸多同樣內容所在的功能變數名稱信任度
指向哪裡的連結最多(原文中的內鏈)
拷貝是否連結回原始出處(版權連結)
由於第二條信號的存在,我們原創作者很多發佈或被轉載在其他網站的內容,無法獲得好的排名。 很多作者也對此有抱怨。 但我們可以利用1、3、4點信號將這個錯誤糾正過來。
百度在這方面做的還不是很好,但谷歌已經可以很快且很准的識別出原文的出處。 這就得益于以上3條。 而其中「拷貝是否連結回原始出處」這一因素,也是我在《使用301重定向將404錯誤轉化為網站外鏈》這篇文章中所闡述的目的之一,還有一個目的大家也看到了就是傳遞權重。
最後,將一個使用者無法訪問的錯誤URL,合理的通過301的方式重定向到正確的URL。 也對使用者體驗有所説明。 我們同樣在谷歌管理員工具的「抓取錯誤」中看到了這句話。
Googlebot 無法抓取該網址,因為它指向的網頁不存在。 通常,404 不會影響您的網站在搜尋結果中的排名,但您可以借助它改善使用者體驗。
解決404錯誤的方式無非是通過robots.txt遮罩,或者通過301重定向。 我不認為遮罩後可以改善使用者體驗。 robots.txt的方式只能改善蜘蛛體驗。 因為使用者點擊錯誤URL後,訪問的還是一個不存在的頁面和看到404錯誤。
反駁第三段
直接複製原話「如果針對不存在的網頁返回 404 或 410 以外的代碼(或將使用者重定向至首頁等其他網頁,而不是返回 404),則可能會出現問題。 首先,這樣就等於告訴搜尋引擎通過該網址可以找到實際的網頁。 結果,搜尋引擎可能會抓取該網址,並將其內容編入索引。 因為 Googlebot 要使用很多的時間處理不存在的網頁,可能無法迅速找到您的網址或頻繁訪問這些網址,也無法頻繁地訪問這些網址,從而影響對您網站內容的抓取量(另外,您一定也不希望自己的網站經常出現在 [未找到檔] 的搜索查詢中)。 」這是404頁面的原話,如果你不按照要求繼續錯誤頁面的跳轉的話,可能出現的情況就是你的網站上出現大量的相同頁面,相同標題,相同描述,相同內容,等等,然後這就是不同的URL和相同的內容之間的故事,至於以後會發生什麼? 這個大家可以自己去百度,自己去google上找找就知道了。
反駁的朋友既然提到了google管理員指南,就千萬別忘記摘錄另外一段文字:
一般來說,404 錯誤不會影響您的網站在 Google 中的排名,因此您可以放心忽略這些錯誤。 這些錯誤通常是由於以下原因導致的:拼寫有誤、配置有誤(例如由內容管理系統自動生成的連結)或 Google 加強了識別和抓取 JAVAscript 等嵌入式內容中的連結的力度。
要查看無效連結的來源,請點擊相關網址。 在錯誤對話方塊中,點選連結自以下網頁標籤。 如果相關連結來自您的網站,請修復或刪除這些連結。 如果這些連結來自外部網站,您可以使用這些資料改善網站的使用者體驗。 例如,如果某人本打算連結到您的網站但卻輸錯了網址,那麼就會出現拼寫有誤的合法網址(如 www.example.com/awesome 拼寫成了 www.example.com/awsome)。 您可以將拼寫有誤的網址 301 重定向到正確的網址並通過該連結獲取預期流量,而不是返回 404 錯誤。 您也可以在將使用者定向到 404 網頁後,確保説明他們找到所需內容,而不是僅僅顯示「404 未找到」。 不過,我們只建議您在錯誤連結可產生較高流量的情況下採取上述措施。
來源連結:HTTPs://support.google.com/webmasters/bin/answer.py?hl=zh-Hans&answer=2409439
很遺憾的是,這位朋友只看到了其一,卻沒有看到其二。 我們在做SEO時,官方的資料非常重要,很多細節都隱藏在其中,需要花大量的時間去仔細閱讀和理解。
實際上,谷歌管理員工具中很多設置和解說文字都是有其道理的。 只是我們一些SEO不願意去理解。 就像404產生的內因和外因這種事情,在「抓取錯誤」一項中將它區分開也是有其道理的。 而不是閑著沒事幹就那麼做了。
總結:作為SEO,我們要吸取很多知識,同時開拓自己的思路和分析問題的辦法。 但需要確保你學習的知識是先進的而不是陳舊的。 否則自己的思路很容易被誤導,從而產生不好的效果。
對觀點的爭論也是SEO工作中非常重要的一個環節。 沒有人可以肯定的說自己的理解是正確的,我們只能拿官方透露出來的一些資料和自己通過資料分析得出來的結論來證明自己思路和理論的正確性。
本文由楊帆原創于楊氏SEO,轉載請保留連結:HTTP://www.seoyangs.com/404-301-original-page.html