如何讓搜尋引擎抓取AJAX內容解決方案_php執行個體

來源:互聯網
上載者:User

越來越多的網站,開始採用"單頁面結構"(Single-page application)。

整個網站只有一張網頁,採用Ajax技術,根據使用者的輸入,載入不同的內容。

這種做法的好處是使用者體驗好、節省流量,缺點是AJAX內容無法被搜尋引擎抓取。舉例來說,你有一個網站。

  http://example.com   

使用者通過井號結構的URL,看到不同的內容。

  http://example.com#1  http://example.com#2  http://example.com#3   

但是,搜尋引擎只抓取example.com,不會理會井號,因此也就無法索引內容。

為瞭解決這個問題,Google提出了"井號+驚嘆號"的結構。

  http://example.com#!1  

當Google發現上面這樣的URL,就自動抓取另一個網址:

  http://example.com/?_escaped_fragment_=1  

只要你把AJAX內容放在這個網址,Google就會收錄。但是問題是,"井號+驚嘆號"非常難看且煩瑣。Twitter曾經採用這種結構,它把

  http://twitter.com/ruanyf  

改成

  http://twitter.com/#!/ruanyf  

結果使用者抱怨連連,只用了半年就廢除了。

那麼,有沒有什麼方法,可以在保持比較直觀的URL的同時,還讓搜尋引擎能夠抓取AJAX內容?

我一直以為沒有辦法做到,直到前兩天看到了Discourse創始人之一的Robin Ward的解決方案,不禁拍案叫絕。

Discourse是一個論壇程式,嚴重依賴Ajax,但是又必須讓Google收錄內容。它的解決方案就是放棄井號結構,採用 History API。

所謂 History API,指的是不重新整理頁面的情況下,改變瀏覽器地址欄顯示的URL(準確說,是改變網頁的目前狀態)。這裡有一個例子,你點擊上方的按鈕,開始播放音樂。然後,再點擊下面的連結,看看發生了什麼事?

地址欄的URL變了,但是音樂播放沒有中斷!

History API 的詳細介紹,超出這篇文章的範圍。這裡只簡單說,它的作用就是在瀏覽器的History對象中,添加一條記錄。

  window.history.pushState(state object, title, url);  

上面這行命令,可以讓地址欄出現新的URL。History對象的pushState方法接受三個參數,新的URL就是第三個參數,前兩個參數都可以是null。

  window.history.pushState(null, null, newURL);   

目前,各大瀏覽器都支援這個方法:Chrome(26.0+),Firefox(20.0+),IE(10.0+),Safari(5.1+),Opera(12.1+)。

下面就是Robin Ward的方法。

首先,用History API替代井號結構,讓每個井號都變成正常路徑的URL,這樣搜尋引擎就會抓取每一個網頁。

  example.com/1  example.com/2  example.com/3  

然後,定義一個JavaScript函數,處理Ajax部分,根據網址抓取內容(假定使用jQuery)。

function anchorClick(link) {
    var linkSplit = link.split('/').pop();
    $.get('api/' + linkSplit, function(data) {
      $('#content').html(data);
    });
  }

再定義滑鼠的click事件。

  $('#container').on('click', 'a', function(e) {
    window.history.pushState(null, null, $(this).attr('href'));
    anchorClick($(this).attr('href'));
    e.preventDefault();
  });  

還要考慮到使用者點擊瀏覽器的"前進 / 後退"按鈕。這時會觸發History對象的popstate事件。

  window.addEventListener('popstate', function(e) {     
    anchorClick(location.pathname);  
   });

定義完上面三段代碼,就能在不重新整理頁面的情況下,顯示正常路徑URL和AJAX內容。

最後,設定伺服器端。

因為不使用井號結構,每個URL都是一個不同的請求。所以,要求伺服器端對所有這些請求,都返回如下結構的網頁,防止出現404錯誤。

  <html>
    <body>
      <section id='container'></section>
      <noscript>
        ... ...
       </noscript>
    </body>
  </html>

仔細看上面這段代碼,你會發現有一個noscript標籤,這就是奧妙所在。

我們把所有要讓搜尋引擎收錄的內容,都放在noscript標籤之中。這樣的話,使用者依然可以執行AJAX操作,不用重新整理頁面,但是搜尋引擎會收錄每個網頁的主要內容!

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.