從去年想這個事情怎麼解決,今年終於算是把他搞清楚了,但驗證碼必須要填。
如果你能像360搶票哪有自動識別驗證碼,那就沒事了。廢話不多扯了。迴歸正題
這裡要用CURL。
設計思路:先登入頁面擷取COOKIES,然後拿著cookies找伺服器要驗證碼。最後提供伺服器需要的全部資訊。
(這種思維是完全類比遊覽器訪問頁面,根本區別出來是人還機器)
| 代碼如下 |
複製代碼 |
public function index(){ $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); //填對於的URL就可以了 curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"); curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file); //主要cookie的路徑,本儲存頁面cookie curl_setopt($ch, CURLOPT_RETURNTRANSFER,1); //返回結果自動輸出 $response = curl_exec($ch); curl_close($ch); }
|
訪問正方教務系統的首頁,第一擷取頁面中的HTML,第二是擷取cookies。
其他的就想問?擷取HTML有啥用?
如果你細心觀察教務系統首頁的HTML的話,你會發現裡面有很多隱藏欄位,而這些欄位又是變化的。
所以你乾脆把HTML都擷取然後解析,然後把需要的欄位都桃出來
看到沒有,那麼的隱藏欄位,都是提交資料的必須,而且不能多。
頁面效果
接下來我要將一個最重要的問題,怎麼擷取驗證碼?
開始我想直接
| 代碼如下 |
複製代碼 |
<img src="xxxx/CheckCode.aspx" />
|
不就行了?這樣驗證碼雖然是出來,但這個驗證碼不屬於你,所以在你存遠程登入時候,都會告訴你,驗證碼錯誤
那怎麼擷取屬於自己的驗證碼呢?這時候,自然想到的是cookies。
伺服器是怎麼區分遊覽器請求是不是同一個人,就看cookies裡面的sessionid了
這樣。你拿著你在首頁擷取到的cookies,再找伺服器要你的驗證碼,它會給錯?
| 代碼如下 |
複製代碼 |
public function getImg() { $url = "http://xxxx/CheckCode.aspx"; $filedir = SITE_PATH."/TMP/Cookies"; $cookie_file = $filedir."/cookie.txt"; $ch = curl_init(); www.111cn.net curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"); curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file); // curl_setopt($ch, CURLOPT_RETURNTRANSFER,1); curl_setopt($ch, CURLOPT_TIMEOUT, "10"); header("Content-type:image/gif"); //這個視不同圖片格式不一樣,請注意 echo curl_exec($ch); curl_close($ch); } |
然後再在其他頁面調用這個方法,你就可以擷取到驗證碼。
CURL的PHP請求跟你遊覽器發出的PHP屬於兩個不同的線程,所以,他們的cookies是不同共用的。
————————–
這樣你就可以登入了,但不要以為這樣登入了,你可以操作全部功能了,那你就想錯了。還有一個很小的細節。。