抓取源碼 - php抓取網頁源碼的問題

來源:互聯網
上載者:User
抓取一般的頁面沒問題·。
但近期給一個網站個搞暈了·。請大神們幫幫忙看看是什麼原因導致失敗。謝謝

地址:http://183.36.249.82/

我們學校的圖書館。

我用的代碼如下

但會出現這個錯誤:

Server Error in '/' Application.

Runtime Error

我用的伺服器是SAE。也試過用SAE提供的fetch功能。

但可惜也是報錯。

錯誤是:string(3) "500" string(21) "Internal Server Error"

多天研究原因不解。求解答。謝謝

回複內容:

抓取一般的頁面沒問題·。
但近期給一個網站個搞暈了·。請大神們幫幫忙看看是什麼原因導致失敗。謝謝

地址:http://183.36.249.82/

我們學校的圖書館。

我用的代碼如下

但會出現這個錯誤:

Server Error in '/' Application.

Runtime Error

我用的伺服器是SAE。也試過用SAE提供的fetch功能。

但可惜也是報錯。

錯誤是:string(3) "500" string(21) "Internal Server Error"

多天研究原因不解。求解答。謝謝

file_get_contents抓取的時候,一般要設定一下HTTP context.抓取網頁還是用cURL比較好.

 array(        'method' => 'GET',        'header' => $header,        'timeout' => 10,        'protocol_version' => '1.1',    ),));$contents = file_get_contents('http://183.36.249.82/', false, $context); echo $contents; 

你沒發現網站要求重新導向了嗎?是剛學php呢吧?換用curl吧,file_get_contents抓不下來這個的吧(顯然我錯了,看別人的回答就知道是可以的,沒文化真可怕啊)。

給你個參考串連吧,我不想寫代碼了
http://segmentfault.com/q/1010000000484804#a-1020000000484819
問問題的人雖然問得是ruby的問題,但是人家的php代碼估計夠你參考用了。

  • 聯繫我們

    該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

    如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

    A Free Trial That Lets You Build Big!

    Start building with 50+ products and up to 12 months usage for Elastic Compute Service

    • Sales Support

      1 on 1 presale consultation

    • After-Sales Support

      24/7 Technical Support 6 Free Tickets per Quarter Faster Response

    • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.