搜尋引擎會不會抓取帶#號(雜湊值)的URL

來源:互聯網
上載者:User

仲介交易 HTTP://www.aliyun.com/zixun/aggregation/6858.html">SEO診斷 淘寶客 雲主機 技術大廳

在我的網站各個位址中,難免出現一些帶#的URL,一般是通過點擊某個連結,跳轉到網頁的某個位置,實現資訊內容的快速定位。 本站使用的文章內目錄就是這樣做的。 但是,這種帶#的URL搜尋引擎會被收錄嗎?

1、什麼是雜湊值?

在阮一峰的博客中有一篇文章可以很好的解釋雜湊值,#值不是HTTP請求,而是一個瀏覽器動作。 通過#,可以快速定位到網頁中的某個具體位置。 例如HTTP://www.souluseo.com/post/122.html#comment-121,就會快速定位到id="comment-121"或這個位置。

2、搜尋引擎會不會抓取帶#號(雜湊值)的URL

答案是一般不會。 搜尋引擎抓取頁面首先要遵循HTTP協定,可是#不是協定內的內容。 而實際上也是這樣,我們沒有見過搜尋引擎的搜尋結果中,哪一條記錄可以快速定位到網頁內的某個位置的。 因此,希望通過在網站內外添加帶#的錨連結來讓搜尋引擎第一次訪問時快速定位是不現實的。 當然,搜尋引擎蜘蛛為了類比真實使用者,在進入網站之後,會通過一些技術實現類比滑鼠點擊的效果,這個時候,頁面的錨連結還是起作用,但任何連結在搜尋結果中時,都不會帶#。

3、URL 中的 #! 有什麼作用?

這是一個違反2中的特例,谷歌會抓取帶有#!的URL。 Google規定,如果你希望Ajax生成的內容被流覽引擎讀取,那麼URL中可以使用"#!" (這種URL在一般頁面一般不會產生定位效果),Google會自動將其後面的內容轉成查詢字串_escaped_fragment_的值。 例如/#!/username等效于/?_escaped_fragment_=/username,而帶?的URL是會被抓取的,所以#!的URL會被谷歌收錄。

4、搜尋引擎會不會抓取帶#號(雜湊值)的URL給我們的啟示

一、不要試圖用robots.txt遮罩#的網址。 我之前翻過一個錯誤,即在嗖錄網的robots.txt中加入了disallow:/*#*規則,以試圖遮罩這些帶#的URL被抓取。 但實際上,這個做法是錯誤的,首先#在robots.txt是注釋符號,它後面的內容會被注釋掉,所以這條規則變成了disallow:/*,即阻止收錄本站所有頁面,幸好我在今早發現,並馬上進行了修改。 其次,搜尋引擎不會抓取帶#的URL,因此沒有必要加一條這樣的規則。

二、可以利用#和ajax結合來隱藏不想被抓取的內容。 在我們的一些網頁中,可能有些內容是我們不想直接告訴搜尋引擎的,或者一些隱私不希望被抓取,因此我們可以採用#來控制這些資訊的顯示。 例如我們增加一個按鈕,當URL中帶#show-info-123時,顯示123的個人資訊,而不帶時不顯示。 而對於搜尋引擎來說,會自動忽略帶#的URL,因此123的個人資訊不會被抓取。

文章來自:嗖錄網;原文位址:HTTP://www.souluseo.com/search-engine-dont-catch-hash-url/ 歡迎大家來嗖錄網交流SEO經驗與技術。

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.