以正方教務系統為例,用php類比登陸抓取課表、空教室,抓取課表_PHP教程

來源:互聯網
上載者:User

以正方教務系統為例,用php類比登陸抓取課表、空教室,抓取課表


  課程格子和超級課程表這兩個應用,想必大學生都很熟悉,使用自己的學號和教務系統的密碼,就可以將自己的課表匯入,隨時隨地都可以在手機上查看。

  其實稍微瞭解一點php的話,我們也可以做一個類似這樣的web 應用。

  1,解決掉驗證碼

    其實這是正方的一個小bug,當我們進入登陸介面時,瀏覽器會去請求伺服器,伺服器會產生一個驗證碼圖片。如果我們不去請求這個圖片,那麼正方後台也不會產生相應的 驗證碼,於是這樣我們就有了可乘之機,讓我高興會兒~這時,我們在不填寫驗證碼的情況下,可以很流暢的進入。大家可以在自己的電腦上禁止訪問驗證碼的地址,然後試試這 是不是真的~當然,這隻對正方有效。

  2,php 的curl 類比登陸

    這裡直接貼一個指令碼之家對 curl 的講解吧 http://www.jb51.net/article/51299.htm

    接下來就是相關代碼了,相信很多人和我一樣,只喜歡看例子,對於長篇大論的講解,轉頭就走……不過這個習慣還是不好……廢話不多說!

    

//類比登陸function curl_request($url,$post='',$cookie='', $returnCookie=0){        $curl = curl_init();        curl_setopt($curl, CURLOPT_URL, $url);        curl_setopt($curl, CURLOPT_USERAGENT, 'Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; Trident/6.0)');        curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);        curl_setopt($curl, CURLOPT_AUTOREFERER, 1);        curl_setopt($curl, CURLOPT_REFERER, "這裡一定要換成教務系統登陸的url"); //填寫教務系統url        if($post) {            curl_setopt($curl, CURLOPT_POST, 1);            curl_setopt($curl, CURLOPT_POSTFIELDS, http_build_query($post));        }        if($cookie) {            curl_setopt($curl, CURLOPT_COOKIE, $cookie);        }        curl_setopt($curl, CURLOPT_HEADER, $returnCookie);        curl_setopt($curl, CURLOPT_TIMEOUT, 20);        curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);        $data = curl_exec($curl);        if (curl_errno($curl)) {            return curl_error($curl);        }        curl_close($curl);        if($returnCookie){            list($header, $body) = explode("\r\n\r\n", $data, 2);            preg_match_all("/Set\-Cookie:([^;]*);/", $header, $matches);            $info['cookie']  = substr($matches[1][0], 1);            $info['content'] = $body;            return $info;        }else{            return $data;        }    }

  3,教務系統登陸頁面的隱藏欄位

    舉個栗子

    

    

    這些東西在登陸的時候也是需要帶上的,順便貼出函數,順便暴漏了博主的學校……皇家種地大學(主要是Regex的運用)

    

    
  //登陸頁面的隱藏欄位
  function getView(){ $url = 'http://jw.hzau.edu.cn/default2.aspx'; $result = curl_request($url); $pattern = '//is'; preg_match_all($pattern, $result, $matches); $res[0] = $matches[1][0]; return $res[0] ;}

  //返回教室查詢頁面的隱藏值
  private function getViewJs($cookie,$xh){
    $url = "http://jw.hzau.edu.cn/xxjsjy.aspx?xh={$xh}";
    $result = curl_request($url,'',$cookie);
    $pattern = '//is';
    preg_match_all($pattern, $result, $matches);
    $res[0] = $matches[1][0];
    return $res[0] ;
  }

  4,cookie 的擷取

    

function login($xh,$pwd){    $url = 'http://jw.hzau.edu.cn/default2.aspx';    $post['__VIEWSTATE'] = $this->getView();    $post['txtUserName'] = $xh; //填寫學號    $post['TextBox2'] = $pwd;  //填寫密碼    $post['txtSecretCode'] = '';    $post['lbLanguage'] = '';    $post['hidPdrs'] = '';    $post['hidsc'] = '';    $post['RadioButtonList1'] = iconv('utf-8', 'gb2312', '學生');    $post['Button1'] = iconv('utf-8', 'gb2312', '登入');    $result = curl_request($url,$post,'', 1);    return $result['cookie'];}

  5,讓我們來試試查課表的功能,格式有點亂額,大家湊合著看,我把課錶轉成了一個二維關聯陣列

    

//返回課表字串private function classresult($xh,$pwd){    date_default_timezone_set("PRC"); //時區設定    $classList = "";//聲明課表變數    $cookie = $this->login($xh,$pwd);    $view = $this->getViewJs($cookie,$xh);//驗證密碼是否正確    //如果密碼正確        if (!empty($view)) {        $url = "http://jw.hzau.edu.cn/xskbcx.aspx?xh={$xh}";        $result = curl_request($url,'',$cookie);  //儲存的cookiespreg_match_all('/
 
  ([\w\W]*?)<\/table>/',$result,$out);        $table = $out[0][0]; //擷取整個課表        preg_match_all('/
  
([\w\W]*?)<\/td>/',$table,$out); $td = $out[1]; $length = count($td); //獲得課程列表 for ($i=0; $i < $length; $i++) { $td[$i] = str_replace("
", "", $td[$i]); $reg = "/{(.*)}/"; if (!preg_match_all($reg, $td[$i], $matches)) { unset($td[$i]); }}$td = array_values($td); //將課程列表數組重新索引$tdLength = count($td);for ($i=0; $i < $tdLength; $i++) { $td[$i] = iconv('GB2312','UTF-8',$td[$i]);}//將課錶轉換成數組形式function converttoTable($table){$list = array('sun' => array('1,2' => '','3,4' => '','5,6' => '','7,8' => '','9,10' => ''),'mon' => array('1,2' => '','3,4' => '','5,6' => '','7,8' => '','9,10' => ''),'tues' => array('1,2' => '','3,4' => '','5,6' => '','7,8' => '','9,10' => ''),'wed' => array('1,2' => '','3,4' => '','5,6' => '','7,8' => '','9,10' => ''),'thur' => array('1,2' => '','3,4' => '','5,6' => '','7,8' => '','9,10' => ''),'fri' => array('1,2' => '','3,4' => '','5,6' => '','7,8' => '','9,10' => ''),'sat' => array('1,2' => '','3,4' => '','5,6' => '','7,8' => '','9,10' => ''));$week = array("sun"=>"周日","mon"=>"周一","tues"=>"周二","wed"=>"周三","thur"=>"周四","fri"=>"周五","sat"=>"周六");$order = array('1,2','3,4','5,6','7,8','9,10');foreach ($table as $key => $value) {$class = $value;foreach ($week as $key => $weekDay) {$pos = strpos($class,$weekDay);// echo $pos;if ($pos) {$weekArrayDay = $key; //擷取list數組中的第一維key foreach ($order as $key => $orderClass) {$pos = strpos($class,$orderClass);if ($pos) {$weekArrayOrder = $orderClass; //擷取該課程是第幾節break;}}break;}}$list[$weekArrayDay][$weekArrayOrder] = $class;}return $list;}//調用函數return converttoTable($td); }else{ return 0; }}

  6,再試試查詢空教室的功能

    

//空教室查詢結果public function roomresult(){$xh = ""; //設定學號$pwd = "";  //學號對應的密碼$cookie = $this->login($xh,$pwd);        $url = "http://jw.hzau.edu.cn/xs_main.aspx?xh={$xh}";        $result = curl_request($url,'',$cookie);  //儲存的cookies        $url="http://jw.hzau.edu.cn/xxjsjy.aspx?xh={$xh}";        $post['Button2'] = iconv('utf-8', 'gb2312', '空教室查詢');        $post['__EVENTARGUMENT']='';        $post['__EVENTTARGET']='';        $post['__VIEWSTATE'] = $this->getViewJs($cookie,$xh);        $post['ddlDsz'] = iconv('utf-8', 'gb2312', '單');        $post['ddlSyXn'] = '2014-2015'; //學年        $post['ddlSyxq'] = '1';         $post['jslb'] = '';        $post['xiaoq'] = '';        $post['kssj']=$_GET['start'];  //提交的開始查詢時間          $post['sjd']=$_GET['class'];//提交的課程節次        $post['xn']='2014-2015';//所在學年        $post['xq']='2';//所在學期        $post['xqj']='6';//當天星期幾        $post['dpDataGrid1:txtPageSize']=90;//每頁顯示條數        $result = curl_request($url,$post,$cookie,0);preg_match_all('/]+>[^>]+span>/',$result,$out);        $tip = iconv('gb2312', 'utf-8', $out[0][3]);//擷取頁面前部的提示內容        preg_match_all('/([\w\W]*?)<\/table>/',$result,$out);        $table = iconv('gb2312', 'utf-8', $out[0][0]); //擷取查詢列表$this->load->view("classroom",array('tip'=>$tip,'table'=>$table));    }

  總結起來就是這些了,每個學校的教務系統都不盡相同,這時我們可以藉助Firefox瀏覽器的 firebug 抓包,看看到底提交了哪些東西。如果不成功,要看看自己該提交的東西post 上去了沒有,如果再不成功,額……可以聯絡我 imzhongshan@126.com

  就這些了,趕快去試試吧!

http://www.bkjia.com/PHPjc/1001450.htmlwww.bkjia.comtruehttp://www.bkjia.com/PHPjc/1001450.htmlTechArticle以正方教務系統為例,用php類比登陸抓取課表、空教室,抓取課表 課程格子和超級課程表這兩個應用,想必大學生都很熟悉,使用自己的學...

  • 聯繫我們

    該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

    如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

    A Free Trial That Lets You Build Big!

    Start building with 50+ products and up to 12 months usage for Elastic Compute Service

    • Sales Support

      1 on 1 presale consultation

    • After-Sales Support

      24/7 Technical Support 6 Free Tickets per Quarter Faster Response

    • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.