首頁  >  文章  >  後端開發  >  以正方教務系統為例,用php模擬登陸抓取課表、空教室

以正方教務系統為例,用php模擬登陸抓取課表、空教室

WBOY
WBOY原創
2016-08-08 09:24:011282瀏覽

  課程格子和超級課表這兩個應用,想必大學生都很熟悉,使用自己的學號和教務系統的密碼,就可以將自己的課表導入,隨時隨地都可以在手機上查看。

  其實稍微了解一點php的話,我們也可以做一個類似這樣的web 應用。

  1,解決掉驗證碼

    其實這是正方的一個小bug,當我們進入登陸介面時,瀏覽器會去請求伺服器,伺服器會產生一個驗證碼圖片。如果我們不去請求這個圖片,那麼正方後台也不會產生對應的       驗證碼,於是這樣我們就有了可乘之機,讓我高興會兒~這時,我們在不填寫驗證碼的情況下,可以很流暢的進入。大家可以在自己的電腦上禁止存取驗證碼的位址,然後試試這        是不是真的~當然,這只對正方有效。

  2,php 的curl 模擬登陸

    這裡直接貼一個腳本之家對curl 的講解吧 http://www.jb51.net/article/51299.htm解『跟我一樣,只喜歡看例子,對於長篇大論的講解,轉頭就走……不過這個習慣還是不好……廢話不多說!

//模拟登陆
	function curl_request($url,$post='',$cookie='', $returnCookie=0){
	        $curl = curl_init();
	        curl_setopt($curl, CURLOPT_URL, $url);
	        curl_setopt($curl, CURLOPT_USERAGENT, 'Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; Trident/6.0)');
	        curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);
	        curl_setopt($curl, CURLOPT_AUTOREFERER, 1);
	        curl_setopt($curl, CURLOPT_REFERER, "这里一定要换成教务系统登陆的url"); //填写教务系统url
	        if($post) {
	            curl_setopt($curl, CURLOPT_POST, 1);
	            curl_setopt($curl, CURLOPT_POSTFIELDS, http_build_query($post));
	        }
	        if($cookie) {
	            curl_setopt($curl, CURLOPT_COOKIE, $cookie);
	        }
	        curl_setopt($curl, CURLOPT_HEADER, $returnCookie);
	        curl_setopt($curl, CURLOPT_TIMEOUT, 20);
	        curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
	        $data = curl_exec($curl);
	        if (curl_errno($curl)) {
	            return curl_error($curl);
	        }
	        curl_close($curl);
	        if($returnCookie){
	            list($header, $body) = explode("\r\n\r\n", $data, 2);
	            preg_match_all("/Set\-Cookie:([^;]*);/", $header, $matches);
	            $info['cookie']  = substr($matches[1][0], 1);
	            $info['content'] = $body;
	            return $info;
	        }else{
	            return $data;
	        }
    }

  3,教務系統登陸頁的隱藏字段

    舉個栗子

    <input type="hidden" name="__VIEWSTATE" value="dDwyODE2NTM0OTg7Oz61eIbnKVojBioGYtg2vsy2SklwiA==">

    暴帶的東西也是耵耵漏登陸的東西也是需要函數的東西。 …皇家種地大學(主要是正規表示式的運用)

<br>  //登陆页面的隐藏字段<br>  function getView(){
	    $url = 'http://jw.hzau.edu.cn/default2.aspx';
	    $result = curl_request($url);
	    $pattern = '/<input type="hidden" name="__VIEWSTATE" value="(.*?)" \/>/is';
	    preg_match_all($pattern, $result, $matches);
	    $res[0] = $matches[1][0];
	         
	    return $res[0] ;
	}
  //返回教室查詢頁面的隱藏值

  private function getViewJs($cookie,$xh){

 〜〜 hzau.edu.cn/xxjsjy.aspx?xh={$xh}";
    $result = curl_request($url,'',$cookie);
    $pattern = ',$cookie);
    $pattern = '//is';
    preg_match_all($pattern, $result, $matches);
    $res[0] = $matches);
   腳[0] ;
  }

  4,cookie 的獲取

function login($xh,$pwd){
	    $url = 'http://jw.hzau.edu.cn/default2.aspx';
	    $post['__VIEWSTATE'] = $this->getView();
	    $post['txtUserName'] = $xh; //填写学号
	    $post['TextBox2'] = $pwd;  //填写密码
	    $post['txtSecretCode'] = '';
	    $post['lbLanguage'] = '';
	    $post['hidPdrs'] = '';
	    $post['hidsc'] = '';
	    $post['RadioButtonList1'] = iconv('utf-8', 'gb2312', '学生');
	    $post['Button1'] = iconv('utf-8', 'gb2312', '登录');
	    $result = curl_request($url,$post,'', 1);
	    return $result['cookie'];
	}

  5,讓我們來試試維查課表的功能,格式有點亂額,  5,讓我們來試試維度關聯數組

//返回课表字符串
private function classresult($xh,$pwd){
    	date_default_timezone_set("PRC"); //时区设置
    	$classList = "";//声明课表变量

    	$cookie = $this->login($xh,$pwd);
    	$view = $this->getViewJs($cookie,$xh);//验证密码是否正确

    	//如果密码正确
        if (!empty($view)) {
        	$url = "http://jw.hzau.edu.cn/xskbcx.aspx?xh={$xh}";
	        $result = curl_request($url,'',$cookie);  //保存的cookies
			preg_match_all('/<table[\w\W]*?>([\w\W]*?)<\/table>/',$result,$out);
	        $table = $out[0][0]; //获取整个课表

	        preg_match_all('/<td [\w\W]*?>([\w\W]*?)<\/td>/',$table,$out);
	        $td = $out[1];
	        $length = count($td);

	    	//获得课程列表
	    	for ($i=0; $i < $length; $i++) { 
	    		$td[$i] = str_replace("<br>", "", $td[$i]);

	    		$reg = "/{(.*)}/";
	    	
	    		if (!preg_match_all($reg, $td[$i], $matches)) {
	    			unset($td[$i]);
	    		}
			}

			$td = array_values($td); //将课程列表数组重新索引
			$tdLength = count($td);
			for ($i=0; $i < $tdLength; $i++) { 
				$td[$i] = iconv('GB2312','UTF-8',$td[$i]);
			}

			//将课表转换成数组形式
			function converttoTable($table){
				$list = array(
					'sun' => array(
						'1,2' => '',
						'3,4' => '',
						'5,6' => '',
						'7,8' => '',
						'9,10' => ''
					),
					'mon' => array(
						'1,2' => '',
						'3,4' => '',
						'5,6' => '',
						'7,8' => '',
						'9,10' => ''
					),
					'tues' => array(
						'1,2' => '',
						'3,4' => '',
						'5,6' => '',
						'7,8' => '',
						'9,10' => ''
					),
					'wed' => array(
						'1,2' => '',
						'3,4' => '',
						'5,6' => '',
						'7,8' => '',
						'9,10' => ''
					),
					'thur' => array(
						'1,2' => '',
						'3,4' => '',
						'5,6' => '',
						'7,8' => '',
						'9,10' => ''
					),
					'fri' => array(
						'1,2' => '',
						'3,4' => '',
						'5,6' => '',
						'7,8' => '',
						'9,10' => ''
					),
					'sat' => array(
						'1,2' => '',
						'3,4' => '',
						'5,6' => '',
						'7,8' => '',
						'9,10' => ''
					)
				);
				$week = array("sun"=>"周日","mon"=>"周一","tues"=>"周二","wed"=>"周三","thur"=>"周四","fri"=>"周五","sat"=>"周六");
				$order = array('1,2','3,4','5,6','7,8','9,10');
				foreach ($table as $key => $value) {
					$class = $value;
					foreach ($week as $key => $weekDay) {
						$pos = strpos($class,$weekDay);
						// echo $pos;
						if ($pos) {
							$weekArrayDay = $key; //获取list数组中的第一维key 
							foreach ($order as $key => $orderClass) {
								$pos = strpos($class,$orderClass);
								if ($pos) {
									$weekArrayOrder = $orderClass; //获取该课程是第几节
									break;
								}
							}
							break;
						}
					}
					$list[$weekArrayDay][$weekArrayOrder] = $class;
				}
				return $list;
			}
					
			//调用函数
			return converttoTable($td);
        }else{
        	return 0;
        }
	}

  6,再試試查詢空教室的功能

//空教室查询结果
	public function roomresult(){
		$xh = ""; //设置学号
		$pwd = "";  //学号对应的密码

		$cookie = $this->login($xh,$pwd);
        $url = "http://jw.hzau.edu.cn/xs_main.aspx?xh={$xh}";
        $result = curl_request($url,'',$cookie);  //保存的cookies

        $url="http://jw.hzau.edu.cn/xxjsjy.aspx?xh={$xh}";
        $post['Button2'] = iconv('utf-8', 'gb2312', '空教室查询');
        $post['__EVENTARGUMENT']='';
        $post['__EVENTTARGET']='';
        $post['__VIEWSTATE'] = $this->getViewJs($cookie,$xh);
        $post['ddlDsz'] = iconv('utf-8', 'gb2312', '单');
        $post['ddlSyXn'] = '2014-2015'; //学年
        $post['ddlSyxq'] = '1'; 
        $post['jslb'] = '';
        $post['xiaoq'] = '';

        $post['kssj']=$_GET['start'];  //提交的开始查询时间  
        $post['sjd']=$_GET['class'];//提交的课程节次

        $post['xn']='2014-2015';//所在学年
        $post['xq']='2';//所在学期
        $post['xqj']='6';//当天星期几
        $post['dpDataGrid1:txtPageSize']=90;//每页显示条数

        $result = curl_request($url,$post,$cookie,0);
		
		preg_match_all('/<span[^>]+>[^>]+span>/',$result,$out);
        $tip = iconv('gb2312', 'utf-8', $out[0][3]);//获取页面前部的提示内容
        preg_match_all('/<table[\w\W]*?>([\w\W]*?)<\/table>/',$result,$out);
        $table = iconv('gb2312', 'utf-8', $out[0][0]); //获取查询列表
		
		$this->load->view("classroom",array('tip'=>$tip,'table'=>$table));
    }

  6,再試試查詢空教室的功能

rrreee

  總結起來就是這些了,每個學校的教務系統都不盡相同,這時我們可以藉助火bug包,看看到底提交了哪些東西。如果不成功,要看看自己該提交的東西post 上去了沒有,如果再不成功,額……可以聯繫我 imzhongshan@126.com

  就這些了,趕快去試試吧!

以上就介紹了以正方教務系統為例,用php模擬登陸抓取課表、空教室,包括了方面的內容,希望對PHP教程有興趣的朋友有所幫助。 🎜 🎜 🎜
陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn