PHP與CURL

來源:互聯網
上載者:User

一 什麼是CURL
curl是一個利用URL文法在命令列方式下工作的檔案傳輸工具。curl是一個利用URL文法在命令列方式下工作的檔案傳輸工具。
它支援很多協議:FTP, FTPS, HTTP, HTTPS, GOPHER, TELNET, DICT, FILE 以及 LDAP。curl同樣支援HTTPS認證,HTTP POST方法, HTTP PUT方法, FTP上傳, kerberos認證, HTTP上傳, Proxy 伺服器, cookies, 使用者名稱/密碼認證, 下載檔案斷點續傳,
上傳檔案斷點續傳, httpProxy 伺服器管道( proxy tunneling), 甚至它還支援IPv6, socks5Proxy 伺服器, 通過httpProxy 伺服器上傳檔案到FTP伺服器等等,功能十分強大。

原來php預設並不進行此項功能的擴充,但還是有的,只是沒有讓它生效罷了。開啟PHP安裝目錄,搜尋以下三個檔案 ssleay32.dll、libeay32.dll和 php_curl.dll,
一一拷貝到系統目錄下的system32檔案夾下,修改php.ini檔案,找到;extension= php_curl.dll行,去掉前面的;號,儲存,重啟伺服器
網站採集,登陸,COOKIE等

二 PHP中的CURL庫

curl_close - 關閉一個curl會話
curl_copy_handle - 拷貝一個curl串連資源的所有內容和參數
curl_errno - 返回一個包含當前會話錯誤資訊的數字編號
curl_error - 返回一個包含當前會話錯誤資訊的字串
curl_exec - 執行一個curl會話
curl_getinfo - 擷取一個curl串連資源控制代碼的資訊
curl_init - 初始化一個curl會話
curl_multi_add_handle - 向curl批處理會話中添加單獨的curl控制代碼資源
curl_multi_close - 關閉一個批處理控制代碼資源
curl_multi_exec - 解析一個curl批處理控制代碼
curl_multi_getcontent - 返回擷取的輸出的文字資料流
curl_multi_info_read - 擷取當前解析的curl的相關傳輸資訊
curl_multi_init - 初始化一個curl批處理控制代碼資源
curl_multi_remove_handle - 移除curl批處理控制代碼資源中的某個控制代碼資源
curl_multi_select - Get all the sockets associated with the cURL extension, which can then be "selected"
curl_setopt_array - 以數組的形式為一個curl設定會話參數
curl_setopt - 為一個curl設定會話參數
curl_version - 擷取curl相關的版本資訊

curl_init()函數的作用初始化一個curl會話,curl_init()函數唯一的一個參數是可選的,表示一個url地址。
curl_exec()函數的作用是執行一個curl會話,唯一的參數是curl_init()函數返回的控制代碼。
curl_close()函數的作用是關閉一個curl會話,唯一的參數是curl_init()函數返回的控制代碼。

三關於CURL_SETOPT()函數的設定

bool curl_setopt (int ch, string option, mixed value)

curl_setopt()函數將為一個CURL會話設定選項。option參數是你想要的設定,value是這個選項給定的值。

下列選項的值將被作為長整形使用(在option參數中指定):

* CURLOPT_INFILESIZE: 當你上傳一個檔案到遠端站台,這個選項告訴PHP你上傳檔案的大小。
* CURLOPT_VERBOSE: 如果你想CURL報告每一件意外的事情,設定這個選項為一個非零值。
* CURLOPT_HEADER: 如果你想把一個頭包含在輸出中,設定這個選項為一個非零值。
* CURLOPT_NOPROGRESS: 如果你不會PHP為CURL傳輸顯示一個進程條,設定這個選項為一個非零值。注意:PHP自動化佈建這個選項為非零值,你應該僅僅為了調試的目的來改變這個選項。
* CURLOPT_NOBODY: 如果你不想在輸出中包含body部分,設定這個選項為一個非零值。
* CURLOPT_FAILONERROR: 如果你想讓PHP在發生錯誤(HTTP代碼返回大於等於300)時,不顯示,設定這個選項為一人非零值。預設行為是返回一個正常頁,忽略代碼。
* CURLOPT_UPLOAD: 如果你想讓PHP為上傳做準備,設定這個選項為一個非零值。
* CURLOPT_POST: 如果你想PHP去做一個正規的HTTP POST,設定這個選項為一個非零值。這個POST是普通的 application/x-www-from-urlencoded 類型,多數被HTML表單使用。
* CURLOPT_FTPLISTONLY: 設定這個選項為非零值,PHP將列出FTP的目錄名列表。
* CURLOPT_FTPAPPEND: 設定這個選項為一個非零值,PHP將應用遠程檔案代替覆蓋它。
* CURLOPT_NETRC: 設定這個選項為一個非零值,PHP將在你的 ~./netrc 檔案中尋找你要建立串連的遠端站台的使用者名稱及密碼。
* CURLOPT_FOLLOWLOCATION: 設定這個選項為一個非零值(象 “Location: “)的頭,伺服器會把它當做HTTP頭的一部分發送(注意這是遞迴的,PHP將發送形如 “Location: “的頭)。
* CURLOPT_PUT: 設定這個選項為一個非零值去用HTTP上傳一個檔案。要上傳這個檔案必須設定CURLOPT_INFILE和CURLOPT_INFILESIZE選項.
* CURLOPT_MUTE: 設定這個選項為一個非零值,PHP對於CURL函數將完全沉默。
* CURLOPT_TIMEOUT: 設定一個長整形數,作為最大延續多少秒。
* CURLOPT_LOW_SPEED_LIMIT: 設定一個長整形數,控制傳送多少位元組。
* CURLOPT_LOW_SPEED_TIME: 設定一個長整形數,控制多少秒傳送CURLOPT_LOW_SPEED_LIMIT規定的位元組數。
* CURLOPT_RESUME_FROM: 傳遞一個包含位元組位移地址的長整形參數,(你想轉移到的開始表單)。
* CURLOPT_SSLVERSION: 傳遞一個包含SSL版本的長參數。預設PHP將被它自己努力的確定,在更多的安全中你必須手工設定。
* CURLOPT_TIMECONDITION: 傳遞一個長參數,指定怎麼處理CURLOPT_TIMEVALUE參數。你可以設定這個參數為TIMECOND_IFMODSINCE 或 TIMECOND_ISUNMODSINCE。這僅用於HTTP。
* CURLOPT_TIMEVALUE: 傳遞一個從1970-1-1開始到現在的秒數。這個時間將被CURLOPT_TIMEVALUE選項作為指定值使用,或被預設TIMECOND_IFMODSINCE使用。

下列選項的值將被作為字串:

* CURLOPT_URL: 這是你想用PHP取回的URL地址。你也可以在用curl_init()函數初始化時設定這個選項。
* CURLOPT_USERPWD: 傳遞一個形如[username]:[password]風格的字串,作用PHP去串連。
* CURLOPT_PROXYUSERPWD: 傳遞一個形如[username]:[password] 格式的字串去串連HTTP代理。
* CURLOPT_RANGE: 傳遞一個你想指定的範圍。它應該是”X-Y”格式,X或Y是被除外的。HTTP傳送同樣支援幾個間隔,用逗句來分隔(X-Y,N-M)。
* CURLOPT_POSTFIELDS: 傳遞一個作為HTTP “POST”操作的所有資料的字串。
* CURLOPT_REFERER: 在HTTP請求中包含一個”referer”頭的字串。
* CURLOPT_USERAGENT: 在HTTP請求中包含一個”user-agent”頭的字串。
* CURLOPT_FTPPORT: 傳遞一個包含被ftp “POST”指令使用的IP地址。這個POST指令告訴遠程伺服器去串連我們指定的IP地址。這個字串可以是一個IP地址,一個主機名稱,一個網路介面名 (在UNIX下),或是‘-’(使用系統預設IP地址)。
* CURLOPT_COOKIE: 傳遞一個包含HTTP cookie的頭串連。
* CURLOPT_SSLCERT: 傳遞一個包含PEM格式認證的字串。
* CURLOPT_SSLCERTPASSWD: 傳遞一個包含使用CURLOPT_SSLCERT認證必需的密碼。
* CURLOPT_COOKIEFILE: 傳遞一個包含cookie資料的檔案的名字的字串。這個cookie檔案可以是Netscape格式,或是堆存在檔案中的HTTP風格的頭。
* CURLOPT_CUSTOMREQUEST: 當進行HTTP請求時,傳遞一個字元被GET或HEAD使用。為進行DELETE或其它操作是有益的,更Pass a string to be used instead of GET or HEAD when doing an HTTP request. This is useful for doing or another, more obscure, HTTP request. 注意: 在確認你的伺服器支援命令先不要去這樣做。下列的選項要求一個檔案描述(通過使用fopen()函數獲得):
* CURLOPT_FILE: 這個檔案將是你放置傳送的輸出檔案,預設是STDOUT.
* CURLOPT_INFILE: 這個檔案是你傳送過來的輸入檔案。
* CURLOPT_WRITEHEADER: 這個檔案寫有你輸出的頭部分。
* CURLOPT_STDERR: 這個檔案寫有錯誤而不是stderr。用來擷取需要登入的頁面的例子,當前做法是每次或許都登入一次,有需要的人再做改進了.

四 相關例子

1 例子
$cookie_jar = tempnam('./tmp','cookie');

$ch = curl_init(); curl_setopt($ch,CURLOPT_URL,'http://******');

curl_setopt($ch, CURLOPT_POST, 1);

$request = 'email_address=&password=&action=';

curl_setopt($ch, CURLOPT_POSTFIELDS, $request);

//把返回來的cookie資訊儲存在$cookie_jar檔案中

curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_jar);

//設定返回的資料是否自動顯示

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

//設定是否顯示頭資訊

curl_setopt($ch, CURLOPT_HEADER, false);

//設定是否輸出頁面內容

curl_setopt($ch, CURLOPT_NOBODY, false);

curl_exec($ch);

curl_close($ch); //get data after login

$ch2 = curl_init();

curl_setopt($ch2, CURLOPT_URL, 'http://*****');

curl_setopt($ch2, CURLOPT_HEADER, false);

curl_setopt($ch2, CURLOPT_RETURNTRANSFER, 1);

curl_setopt($ch2, CURLOPT_COOKIEFILE, $cookie_jar);

$orders = curl_exec($ch2);

echo '';

echo strip_tags($orders);

echo '';

curl_close($ch2);

2、

set_time_limit(0);
//設定程式執行時間無限制
$i=10000;
//耍10000次
for($j=0;$j<$i;$j++)
{

$URL="http://www.yoururl.com/bbs/savepost.asp";
//這個地址是回複表單裡面action的url地址
$ch = curl_init();

curl_setopt($ch,CURLOPT_URL,$URL);

curl_setopt($ch,CURLOPT_REFERER,"http://www.hxfoods.com/bbs/dispbbs.asp?boardid=14&replyid=672709&id=127437&page=1&skin=0&Star=53");
//設定來源地址,如果不設定,論壇伺服器有可能有驗證不允許回複
curl_setopt($ch,CURLOPT_COOKIESESSION,true);
//能儲存cookie
curl_setopt($ch,CURLOPT_COOKIE,"DvForum=userid=24122&usercookies=0&userhidden=2&password=w0reu3g775VrY745&userclass=%96%7C&username=%A1%FA%A1%FA%B8%D2%CB%C0%B6%D3%A1%FA&StatUserID=2194783945 ");
//這兒就是設定cookie了
curl_setopt($ch,CURLOPT_POST,1);
curl_setopt($ch,CURLOPT_NOBODY,1);
//不顯示內容,因為有很多論壇回複後要自動跳轉。
curl_setopt($ch,CURLOPT_POSTFIELDS,'Body=gfdfgdfgasdfgdfgdfgdfg& followup=672709&RootID=127437&star=58&TotalUseTable=Dv_bbs3& amp;UserName=→→敢死隊→&signflag=1&total=65535');
//把你分析的回複表單的參數分別賦值
curl_setopt ($ch, CURLOPT_HEADER,true);
curl_exec($ch);
if (curl_errno($ch))
{
print curl_error($ch);
}
else
{
curl_close($ch);
}

}

總結:
步驟:
1 整個操作過程中第一步是用cur_init()函數進行初始化,一般為傳遞一個url
$curl = curl_init('www.example.com');
2 然後,用curl_setopt()函數進行設定選項。
3 設定後,進行執行事務
curl_exec($curl);
4 最後關閉curl_close();

常用
1 curl_setopt($curl,CURLOPT_FAILONERROR,1);讓CURL在發生錯誤時終止運行。
2 curl_setopt($curl,CURLOPT_FOLLOWLOCATION,1);讓CURL允許重新導向
3 curl_setopt($curl,CURLOPT_POST,1);讓CURL使用POST方法
4 curl_setopt($curl,CURLOPT_TIMOUT,5);設定逾時間
5 curl_setopt($curl,CURLOPT_POSTFIELDS,"$DATA");設定POST資料

另一個小例子:
define( "COOKIEJAR", tempnam( ini_get( "upload_tmp_dir" ), "cookie" ) );
$request = curl_init();
curl_setopt($request,CURLOPT_URL,'http://127.0.0.1/form.php');
curl_setopt($request,CURLOPT_POST,1);
curl_setopt($request,CURLOPT_POSTFIELDS,"sb=xx&name=pp");//POST方式如何傳值
curl_setopt($request,CURLOPT_RETURNTRANSFER,TRUE);
curl_setopt($request, CURLOPT_COOKIEJAR, COOKIEJAR );//如何設定COOKIE
curl_setopt($request, CURLOPT_COOKIEFILE, COOKIEJAR );
$content = curl_exec($request);
echo $content;

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.