抓取AJAX網頁的方法-Firefox組件,C#整合

來源:互聯網
上載者:User

現在AJAX的使用越來越廣泛了,但是如果經常寫網頁抓取程式的人會發現,很多網頁內容是通用AJAX進行載入的,實際抓取到的內容寥寥無幾。

通過網路到處尋找方法,發現用firefox瀏覽器能夠正常把AJAX內容通過HTML呈現出來,那麼是否意味著我們擷取AJAX網頁有希望了?

功夫不負有心人,進一步研究發現,firefox確實有一款C#組件,可以用C#整合到傳統型程式中。

1)需要引用一個叫Skybound.Gecko.dll的檔案。

2)此外還需要匯入一個firefox支援的檔案夾,代碼如下:

Xpcom.Initialize(@"C:\xulrunner-1.9.1.14.en-US.win32.sdk\xulrunner-sdk\bin");

xulrunner-1.9.1.14.en-US.win32.sdk這個檔案夾比較大,壓縮後都有二十多M,無法上傳,可以去google一下,但是記得一定要搜這個名字,因為我試過其它的有些不能用。

3)直接指定URL就可以訪問網站了,可以通過this.geckoWebBrowser1.Navigate(URL);來指定。還有很多功能,自己去發現吧。

 

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.