來源:互聯網
上載者:User
關鍵字
php的curl擷取有301—302跳轉檔案出錯問題解決
php的curl擷取有301—302跳轉檔案出錯問題解決
PHP的cURL庫簡單和有效地抓網頁
使用PHP的cURL庫可以簡單和有效地去抓網頁。你只需要運行一個指令碼,然後分析一下你所抓取的網頁,然後就可以以程式的方式得到你想要的資料了。無論是你想從從一個連結上取部分資料,或是取一個XML檔案並把其匯入資料庫,那怕就是簡單的擷取網頁內容,cURL 是一個功能強大的PHP庫。本文主要講述如果使用這個PHP庫。
啟用 cURL 設定
首先,我們得先要確定我們的PHP是否開啟了這個庫,你可以通過使用php_info()函數來得到這一資訊。
如果你可以在網頁上看到下面的輸出,那麼表示cURL庫已被開啟。
如果你看到的話,那麼你需要設定你的PHP並開啟這個庫。如果你是在Windows平台下,那麼非常簡單,你需要改一改你的php.ini檔案的設定,找到php_curl.dll,並取消前面的分號注釋就行了。如下所示:
如果你是在Linux下面,那麼,你需要重新編譯你的PHP了,編輯時,你需要開啟編譯參數——在configure命令上加上―–with-curl‖ 參數。
一個小樣本
如果一切就緒,下面是一個小常式:
// 初始化一個 cURL 對象
$curl = curl_init();
// 設定你需要抓取的URL
curl_setopt($curl, CURLOPT_URL, 'http://www.php.cn');
// 設定header
curl_setopt($curl, CURLOPT_HEADER, 1);
// 設定cURL 參數,要求結果儲存到字串中還是輸出到螢幕上。
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
// 運行cURL,請求網頁
$data = curl_exec($curl);
// 關閉URL請求
curl_close($curl);
// 顯示獲得的資料