首頁 >後端開發 >php教程 >网页爬虫 - php curl 如何获取验证码session_id?

网页爬虫 - php curl 如何获取验证码session_id?

WBOY
WBOY原創
2016-06-06 20:27:122603瀏覽

今天在试着用curl登陆,验证码手动输入。

问题和 如何用curl模拟带有图片验证码的表单登录? 类似

而我的问题在于如何在拉取图片的时候拿到session或者设置?

(那个问题的第一个答案并不能正确运行)

求大神解答。

回复内容:

今天在试着用curl登陆,验证码手动输入。

问题和 如何用curl模拟带有图片验证码的表单登录? 类似

而我的问题在于如何在拉取图片的时候拿到session或者设置?

(那个问题的第一个答案并不能正确运行)

求大神解答。

<code>$cookie_file = dirname(__FILE__).'/cookies/'.$user.'cookie.txt';
// 初始化
$curl = curl_init('http://');
$header = array();
$header[] = 'User-Agent: Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36';
curl_setopt($curl, CURLOPT_HTTPHEADER, $header);
// 不输出header头信息
curl_setopt($curl, CURLOPT_HEADER, 0);
// 保存到字符串而不是输出
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($curl, CURLOPT_COOKIEJAR,  $cookie_file); //存储cookies
// post数据
curl_setopt($curl, CURLOPT_POST, 1);
// 请求数据
curl_setopt($curl, CURLOPT_POSTFIELDS, $post);
// 是否抓取跳转后的页面
curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);
$response = curl_exec($curl);
curl_close($curl);</code>

获取session

自己改下,不是通用的。别来说不行

<code>    //获取cookies值
    private function getCookies(){
        $curl = curl_init('http://113.57.132.2:83/login.aspx');
        // 不输出header头信息
        curl_setopt($curl, CURLOPT_HEADER, 1);
        curl_setopt($curl, CURLOPT_NOBODY, 1); 
        // 伪装浏览器
        curl_setopt($curl, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.118 Safari/537.36');
        // 保存到字符串而不是输出
        curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
        $rs = curl_exec($curl);
        curl_close($curl);
        preg_match('%ASP.NET_SessionId=.*?;%sim',$rs,$arr);
        $cookies=str_replace('ASP.NET_SessionId=','',$arr[0]);
        $cookies=rtrim($cookies,';');
        return $cookies;
        //$this->$cookies=rtrim($cookies,';');
    }</code>
陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn