用C#抓取AJAX頁面的內容

來源:互聯網
上載者:User

標籤:blog   http   使用   檔案   for   問題   html   代碼   

現在的網頁有相當一部分是採用了AJAX技術,不管是採用C#中的WebClient還是HttpRequest都得不到正確的結果,因為這些指令碼是在伺服器發送完畢後才執行的!
但我們用IE瀏覽頁面時是正常的,所以解決方案只有1個就是採用WebBrowser控制項
但是使用Webbrowser你會發現,在DownloadComplete事件中,你根本無法知道頁面何時才算是真正的載入完畢!
當然個別有Frame的網頁可能會觸發多次Complete,即使你採用計數器的辦法,即在Navigated事件中++,而在DownloadComplete中做--,也仍然不能得到JS完成執行後的結果,我開始也感覺到非常奇怪,直到後來GG了相關AJAX的文章,明白了其中原委.
最終解決方案就是利用WebBrowser+Timer來解決抓取頁面的問題
而其中的關鍵仍然是頁面狀態,我們可以利用webBrowser1.StatusText,如果返回"完成",表示頁面載入完畢!

範例程式碼如下: 

private void timer1_Tick(object sender, EventArgs e)        {                                 textBox1.Text += webBrowser1.StatusText;                 if (webBrowser1.StatusText == "完成")            {                               timer1.Enabled = false;                //頁面載入完成,做一些其它的事                textBox1.Text += webBrowser1.Document.Body.OuterHtml;                 //webBrowser1.DocumentText 注意不要用這個,這個和查看源檔案一樣的            }        }              private void Form1_Load(object sender, EventArgs e)        {            string Url = "http://cd.mei8.cn/face/work/windex.aspx?btn=6";            webBrowser1.Navigate(Url);        }

  

  


          放三個控制項,webBrowser,timer,textBox timer設定為可用

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.