CURL的學習和應用(附多線程實現)_PHP教程

來源:互聯網
上載者:User
curl安裝:

windows下面的安裝
:修改php.ini檔案的設定,找到php_curl.dll
//取消下在的注釋extension=php_curl.dll
linux下面安裝:
複製代碼 代碼如下:
# wget http://curl.haxx.se/download/curl-7.17.1.tar.gz
# tar zxvf curl-7.17.1.tar.gz //解壓
#cd curl-7.17.1
# ./configure –prefix=/usr/local/curl
# make
# make install


這是安裝php之前安裝的方法.
***************************phpinf查看是否載入成功!
使用curl的POST資料飛信介面
用curl 寫了飛信介面吧,網上有很多,這裡只是做個測試
複製代碼 代碼如下:
$username = 13800138000;
$password = 123456;
$sendto = 13912345678;
$message = "測試一個試試看!";
$curlPost = 'username='.urlencode($username).'&password='.urlencode($password).'&sendto='.urlencode($sendto).'&message='.urlencode($message).'';
$ch = curl_init();//初始化curl
curl_setopt($ch,CURLOPT_URL,'http://sms.api.bz/fetion.php');//抓取指定網頁
curl_setopt($ch, CURLOPT_HEADER, 0);//設定header
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);//要求結果為字串且輸出到螢幕上
curl_setopt($ch, CURLOPT_POST, 1);//post提交方式
curl_setopt($ch, CURLOPT_POSTFIELDS, $curlPost);
$data = curl_exec($ch);//運行curl
curl_close($ch);
print_r($data);//輸出結果


返回的結果是:簡訊已提交到發送隊列!
飛信介面的地址是http://sms.api.bz/
飛信介面模式:
http://sms.api.bz/fetion.php?username=您的移動飛信登入手機號
&password=您的移動飛信登入密碼
&sendto=接收簡訊的飛信好友手機號
&message=簡訊內容
格式:http://sms.api.bz/fetion.php?username=13800138000&password=123456&sendto=13912345678&message=簡訊內容
注意要保持utf-8格式的,這點我犯錯了

總結一下使用curl方法:

初始化curl

使用curl_setopt設定目標url,和其他選項,這些選項方法詳細參考:http://cn2.php.net/manual/zh/ref.curl.php

curl_exec,執行curl

執行後,關閉curl
最後一步就是輸出
一個最要的curl函數:curl_getinfo
curl_getinfo ( resource $ch [, int $opt = 0 ] )

複製代碼 代碼如下:
/*curl執行個體
*/
$curl = curl_init();
// 設定你需要抓取的URL
curl_setopt($curl, CURLOPT_URL, 'http://www.baidu.com');
// 設定header
curl_setopt($curl, CURLOPT_HEADER, 0);
// 設定cURL 參數,要求結果儲存到字串中還是輸出到螢幕上。
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
// 運行cURL,請求網頁
$data = curl_exec($curl);
if($data === false){
echo curl_error($curl);exit;
}
$info = curl_getinfo($curl);
// 關閉URL請求
curl_close($curl);

// 顯示獲得的資料
var_dump($info);
var_dump($data);


可以返回:

URLINFO_EFFECTIVE_URL – 最後一個有效URL地址
CURLINFO_HTTP_CODE – 最後一個收到的HTTP代碼
CURLINFO_FILETIME – 遠程擷取文檔的時間,如果無法擷取,則傳回值為“-1”
CURLINFO_TOTAL_TIME – 最後一次傳輸所消耗的時間
CURLINFO_NAMELOOKUP_TIME – 名稱解析所消耗的時間
CURLINFO_CONNECT_TIME – 建立串連所消耗的時間
CURLINFO_PRETRANSFER_TIME – 從建立串連到準備傳輸所使用的時間
CURLINFO_STARTTRANSFER_TIME – 從建立串連到傳輸開始所使用的時間
CURLINFO_REDIRECT_TIME – 在事務傳輸開始前重新導向所使用的時間
CURLINFO_SIZE_UPLOAD – 上傳資料量的總值
CURLINFO_SIZE_DOWNLOAD – 下載資料量的總值
CURLINFO_SPEED_DOWNLOAD – 平均下載速度
CURLINFO_SPEED_UPLOAD – 平均上傳速度
CURLINFO_HEADER_SIZE – header部分的大小
CURLINFO_HEADER_OUT – 發送請求的字串
CURLINFO_REQUEST_SIZE – 在HTTP請求中有問題的請求的大小
CURLINFO_SSL_VERIFYRESULT – 通過設定CURLOPT_SSL_VERIFYPEER返回的SSL認證驗證請求的結果
CURLINFO_CONTENT_LENGTH_DOWNLOAD – 從Content-Length: field中讀取的下載內容長度
CURLINFO_CONTENT_LENGTH_UPLOAD – 上傳內容大小的說明
CURLINFO_CONTENT_TYPE – 下載內容的Content-Type:值,NULL表示伺服器沒有發送有效Content-Type: header

使用curl實現多線程

curl一般用來抓取網頁,第二種就是get或者post資料,第三種應用就是實現PHP的多線程任務
下面來實現多線程的

複製代碼 代碼如下:
/*
curl 多線程抓取
*/
/**
* curl 多線程
*
* @param array $array 並行網址
* @param int $timeout 逾時時間
* @return array
*/
function Curl_http($array,$timeout){
$res = array();
$mh = curl_multi_init();//建立多個curl語柄
$startime = getmicrotime();
foreach($array as $k=>$url){
$conn[$k]=curl_init($url);

curl_setopt($conn[$k], CURLOPT_TIMEOUT, $timeout);//設定逾時時間
curl_setopt($conn[$k], CURLOPT_USERAGENT, 'Mozilla/5.0 (compatible; MSIE 5.01; Windows NT 5.0)');
curl_setopt($conn[$k], CURLOPT_MAXREDIRS, 7);//HTTp定向層級
curl_setopt($conn[$k], CURLOPT_HEADER, 0);//這裡不要header,加塊效率
curl_setopt($conn[$k], CURLOPT_FOLLOWLOCATION, 1); // 302 redirect
curl_setopt($conn[$k],CURLOPT_RETURNTRANSFER,1);
curl_multi_add_handle ($mh,$conn[$k]);
}
//防止死迴圈耗死cpu 這段是根據網上的寫法
do {
$mrc = curl_multi_exec($mh,$active);//當無資料,active=true
} while ($mrc == CURLM_CALL_MULTI_PERFORM);//當正在接受資料時
while ($active and $mrc == CURLM_OK) {//當無資料時或請求暫停時,active=true
if (curl_multi_select($mh) != -1) {
do {
$mrc = curl_multi_exec($mh, $active);
} while ($mrc == CURLM_CALL_MULTI_PERFORM);
}
}

foreach ($array as $k => $url) {
curl_error($conn[$k]);
$res[$k]=curl_multi_getcontent($conn[$k]);//獲得返回資訊
$header[$k]=curl_getinfo($conn[$k]);//返回頭資訊
curl_close($conn[$k]);//關閉語柄
curl_multi_remove_handle($mh , $conn[$k]); //釋放資源
}

curl_multi_close($mh);
$endtime = getmicrotime();
$diff_time = $endtime - $startime;

return array('diff_time'=>$diff_time,
'return'=>$res,
'header'=>$header
);

}
//計算目前時間
function getmicrotime() {
list($usec, $sec) = explode(" ",microtime());
return ((float)$usec + (float)$sec);
}

//測試一下,curl 三個網址
$array = array(
"http://www.weibo.com/",
"http://www.renren.com/",
"http://www.qq.com/"
);
$data = Curl_http($array,'10');//調用
var_dump($data);//輸出

?>


關於do while的那段解釋:

因為$active要等全部url資料接受完畢才變成false,所以這裡用到了curl_multi_exec的傳回值判斷是否還有資料,
當有數 據的時候就不停調用curl_multi_exec,暫時沒有資料就進入select階段,新資料一來就可以被喚醒繼續執行。
這裡的好處就是CPU的無謂 消耗沒有了。更詳細的說明:http://hi.baidu.com/%D4%C2%D2%B9%C4%FD%ED%F8/blog/item/9dfcf4fbe6b84374024f563d.html

這個多線程的寫法步驟:
第一步:調用curl_multi_init
第二步:迴圈調用curl_multi_add_handle
這一步需要注意的是,curl_multi_add_handle的第二個參數是由curl_init而來的子handle。
第三步:持續調用curl_multi_exec
第四步:根據需要迴圈調用curl_multi_getcontent擷取結果
第五步:調用curl_multi_remove_handle,並為每個字handle調用curl_close
第六步:調用curl_multi_close
多線程的測試:

總結:36個http請求,從執行的是時間順序上來看,三個網站的ip交叉,說明是同時並發的!
—————————————————————————
linux命令下的curl
幾種常見的使用方式:
下載作用:
直接下載 相當於wget
curl -o 1.jpg http://cgi2.tky.3web.ne.jp/~zzh/screen1.JPG
批量下載screen1.JPG–screen10.JPG
curl -O http://cgi2.tky.3web.ne.jp/~zzh/screen[1-10].JPG
斷點下載
curl -c -O http://cgi2.tky.3wb.ne.jp/~zzh/screen1.JPG


反向 Proxy功能
curl -x 123.45.67.89:1080 -o page.html http://www.yahoo.com
顯示標頭檔
curl -I www.sina.com

http://www.bkjia.com/PHPjc/327381.htmlwww.bkjia.comtruehttp://www.bkjia.com/PHPjc/327381.htmlTechArticlecurl安裝: windows下面的安裝 :修改php.ini檔案的設定,找到php_curl.dll //取消下在的注釋extension=php_curl.dll linux下面安裝: 複製代碼 代碼如下...

  • 聯繫我們

    該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

    如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

    A Free Trial That Lets You Build Big!

    Start building with 50+ products and up to 12 months usage for Elastic Compute Service

    • Sales Support

      1 on 1 presale consultation

    • After-Sales Support

      24/7 Technical Support 6 Free Tickets per Quarter Faster Response

    • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.