ホームページ  >  記事  >  バックエンド開発  >  CURL ログイン Web サイトについて質問する

CURL ログイン Web サイトについて質問する

WBOY
WBOYオリジナル
2016-06-20 12:38:13954ブラウズ

皆さんに聞きたいのですが、curl を使用して Web サイトにログインできませんでした。アドバイスをいただけますか。

まず、申請の背景について話しましょう:
http://my.tri.co.id/login/init,
この Web サイトは電話相談 Web サイトです。現在のテレホン カード トラフィックはインドネシアの Web サイトです。

ログインエージェントとしてphpを使用し、自動クエリとサマリーを実現したいと考えています。

この Web サイトにはログイン時に確認コードがあります。つまり、サーバーはセッションを使用してユーザーと識別コードとの間に 1 対 1 の対応を確立します。

curl を使用してブラウザの投稿と同じ生データを取得しましたが、それでもログインは失敗しました。

ブラウザの生ストリーム:

721 バイトが 180.214.234.59:80 に送信されました

POST /login/submit HTTP/1.1
ホスト: my.tri.co 。 id
接続: キープアライブ
キャッシュ制御: max-age=0
受け入れ: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,* / *;q=0.8
オリジン: http://my.tri.co.id
安全でないアップグレード要求: 1
ユーザー エージェント: Mozilla/5.0 (Windows NT 10.0; Win64; x64 ) AppleWebKit/537.36 (KHTML、Gecko など) Chrome/47.0.2526.111 Safari/537.36
Content-Type: application/x-www-form-urlencoded
Referer: http://my.tri.co.id /ログイン/送信
Accept-Encoding: gzip、deflate
Accept-Language: en-US,en;q=0.8
Cookie: BIGipServerSC_frontend_pool=123211018.37151.0000; JSESSIONID=BAD8502FE89E3929E468 FCEB255DFA77
コンテンツの長さ: 68

modelName=login&msisdn=089506850651&password=indonesia&checkNum=6998

curl シミュレートされた生ストリーム:

721 バイトが 180.214.234.5 9:80

POST /login/submit HTTP/1.1
ホスト: my.tri.co.id
Cookie: BIGipServerSC_frontend_pool=123211018.37407.0000; JSESSIONID=EE68C4C157664FB0E964FFB1A950968A
接続: キープアライブ
キャッシュ制御: 最大-age=0
受け入れる: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
オリジン: http://my.tri .co.id
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML、Gecko など) Chrome/47.0.2526.111 Safari/537.36
Content-Type: application/x-www-form-urlencoded
Referer: http://my.tri.co.id/login/submit
Accept-Encoding: gzip、deflate
Accept -Language: en-US,en;q=0.8
Content-Length: 68

modelName=login&msisdn=089506850651&password=indonesia&checkNum=4608


ただし、返されるデータは異なりますつまり、プログラムによって返されるページは、ログインに成功した後のページではありません。

ブラウザが返されます:

http/1.1 302は一時的に移動しました
サーバー:apache-coyote/1.1
set-cookie:jsessionid = 5830130390F707D68D4E4655557B9F0 54;場所 : http://my.tri.co.id/
コンテンツ言語: en-US
日付: 火曜日、2016 年 1 月 26 日 14:13:19 GMT
コンテンツの長さ: 0


curl の戻り値:

HTTP/1.1 200 OK
サーバー: Apache-Coyote/1.1
Content-Type: text/html;charset=UTF-8
コンテンツ言語: en-US
変更: Accept-Encoding
日付: 火曜日、2016 年 1 月 26 日 16:09:49 GMT
コンテンツの長さ: 5569


私のプログラム次の実装のlogin.phpです:
====================================== === ===================

<?php /**   * Demo for the parallel HTTP client   *   * @author hightman <hightman@twomice.net>   * @link http://hightman.cn   * @copyright Copyright (c) 2015 Twomice Studio.   */   // set cookie file $cookie_file = dirname(__FILE__) . '\cookie.txt'; echo $cookie_file . "<br />";   $usr_form_name = 'usr'; $pwd_form_name = 'pwd'; $check_num_form_name = 'check_num';   $post_url = 'http://my.tri.co.id/login/submit';   $usr = $_POST[$usr_form_name]; $pwd = $_POST[$pwd_form_name]; $check_num = $_POST[$check_num_form_name];   //echo $usr . " " . $pwd . " " .$check_num;   $tri_usr_form_name = 'msisdn'; $tri_pwd_form_name = 'password'; $tri_check_num_form_name = 'checkNum'; $tri_mode_form_name = 'modelName';   $fields = array(              $tri_mode_form_name => urlencode('login'),               $tri_usr_form_name => urlencode($usr),               $tri_pwd_form_name => urlencode($pwd),               $tri_check_num_form_name => urlencode($check_num)          );   //url-ify the data for the POST $fields_string = ''; foreach($fields as $key=>$value) { $fields_string .= $key.'='.$value . '&'; } print $fields_string . "<br />"; $fields_string = substr($fields_string, 0, strlen($fields_string)-1); rtrim($fields_string, "&"); print $fields_string . "<br />";   //open connection $ch = curl_init();           $header[] = "Connection: keep-alive";  $header[] = "Cache-Control: max-age=0";  $header[] = "Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8"; $header[] = "Origin: http://my.tri.co.id"; $header[] = "Upgrade-Insecure-Requests: 1"; $header[] = "User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.111 Safari/537.36"; $header[] = "Content-Type: application/x-www-form-urlencoded"; $header[] = "Referer: http://my.tri.co.id/login/submit"; $header[] = "Accept-Encoding: gzip, deflate"; $header[] = "Accept-Language: en-US,en;q=0.8";   curl_setopt($ch, CURLOPT_HTTPHEADER, $header);    //set the url, number of POST vars, POST data curl_setopt($ch, CURLOPT_URL, $post_url); curl_setopt($ch, CURLOPT_REFERER, 'http://my.tri.co.id');   //curl_setopt($ch,CURLOPT_POST, 1); curl_setopt($ch, CURLOPT_CUSTOMREQUEST, "POST"); curl_setopt($ch ,CURLOPT_POSTFIELDS, $fields_string);   curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false); //curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 0);   //curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch,CURLOPT_RETURNTRANSFER, true);   curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file); curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file); //使用上面获取的cookies   curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); // 使用自动跳转     curl_setopt($ch, CURLOPT_ENCODING, "");   //execute post $result = curl_exec($ch);   if (!$result) {      $error = curl_error();      echo $error . "<br />"; } else {      print "result length: " . strlen($result) . "<br />"; }   $rinfo=curl_getinfo($ch);    curl_close($ch);   print $result;
=================== === ==================================

ここでの考え方は、まず私がuse (index .php、ログインインターフェースの表示)curlはCookieとログイン識別コード画像の取得を実装し、それを自分のlogin.phpに送信して処理します。ログインを完了するには、login.php のソース コードを上に示します。

但不知道是什么原因导致失败。 
  
真心请教各位,谢谢! 


回复讨论(解决方案)

先访问表单页,获取 cookie 变量 JSESSIONID 和 BIGipServerSC_frontend_pool
再访问校验码url(带上cookie变量),获取 cookie 变量
***** 这里有人工介入,所以必须以文件方式保存 cookie,并防止共享冲突(最好是以用户id为文件名)
提交表单数据(含校验码)到表单目标页(带上cookie变量)

curl_setopt($ch ,CURLOPT_POSTFIELDS,  $fields_string);
$fields_string 可以是关联数组,并不需要你费心组装。如果一定想用字符串,那也可以使用 http_build_query 函数

先访问表单页,获取 cookie 变量 JSESSIONID 和 BIGipServerSC_frontend_pool
再访问校验码url(带上cookie变量),获取 cookie 变量
***** 这里有人工介入,所以必须以文件方式保存 cookie,并防止共享冲突(最好是以用户id为文件名)
提交表单数据(含校验码)到表单目标页(带上cookie变量)

curl_setopt($ch ,CURLOPT_POSTFIELDS,  $fields_string);
$fields_string 可以是关联数组,并不需要你费心组装。如果一定想用字符串,那也可以使用 http_build_query 函数



cookie 已经在前一个页面的处理中拿到了。在login.php中就是使用。我也查看了cookie的数据,session id数据是一样的。另外从raw stream 的数据来看,所有的数据也是一样。

但是登录就是不对。不知道您对这个现象怎么看?

先访问表单页,获取 cookie 变量 JSESSIONID 和 BIGipServerSC_frontend_pool
再访问校验码url(带上cookie变量),获取 cookie 变量
***** 这里有人工介入,所以必须以文件方式保存 cookie,并防止共享冲突(最好是以用户id为文件名)
提交表单数据(含校验码)到表单目标页(带上cookie变量)

curl_setopt($ch ,CURLOPT_POSTFIELDS,  $fields_string);
$fields_string 可以是关联数组,并不需要你费心组装。如果一定想用字符串,那也可以使用 http_build_query 函数



我的处理流程也就是您这个思路。

<?php/** * Demo for the parallel HTTP client * * @author hightman <hightman@twomice.net> * @link http://hightman.cn * @copyright Copyright (c) 2015 Twomice Studio. */header('content-type:text/html; charset=utf-8');//防止生成的页面乱码$title = '科技有限公司';$temp_file = 'template.html';$dest_file = 'login.html';// set cookie file$cookie_file = dirname(__FILE__) . '\cookie.txt';echo $cookie_file, PHP_EOL;//$http->setCookiePath($cookie_file);// simple load response contents$link_header = 'http://my.tri.co.id';$response_len = 0;$loop_times = 0;$login_url = $link_header . '/login/init';//先获取cookies并保存$ch = curl_init($login_url); //初始化curl_setopt($ch, CURLOPT_HEADER, 0); //不返回header部分curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); //返回字符串,而非直接输出curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file); //存储cookiescurl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file);$response = curl_exec($ch);curl_close($ch);//echo number_format(strlen($response)) . ' bytes', PHP_EOL;//echo $response;$img_link_header = '/verifycode;jsessionid';$img_link_tail = '?sessionKey=loginCN&null';$header_pos = strpos($response, $img_link_header);$tail_pos = strpos($response, $img_link_tail, $header_pos) + strlen($img_link_tail);//echo 'header pos: ' . $header_pos, PHP_EOL;//echo 'tail pos: ' . $tail_pos, PHP_EOL;$img_link = $link_header . substr($response, $header_pos, $tail_pos - $header_pos);$jsession_id_header = 'jsessionid=';$session_key_header = '?sessionKey';$session_id_pos = strpos($img_link, $jsession_id_header);$session_key_pos = strpos($img_link, $session_key_header);$session_id = substr($img_link, 						$session_id_pos + strlen($jsession_id_header), 						$session_key_pos - $session_id_pos - strlen($jsession_id_header));echo $img_link, PHP_EOL;echo $session_id, PHP_EOL;$fp = fopen($temp_file, "r"); //只读打开模板$str = fread($fp, filesize($temp_file));//读取模板中内容fclose($fp);$str = str_replace("{penglig_site_title}", $title, $str);//替换内容$str = str_replace("{img_url}", $img_link, $str);//替换内容echo $str;


从代码可以看出,我也是先打开第一个页面,设置cookie,并且拿到验证码图片的链接并在自己的网页上显示,人工进行识别并输入,然后点击自己的提交数据 post 到 login.php ,也就是1楼的代码里面去。

那你就跟踪一下,看看那个环节出了问题

那你就跟踪一下,看看那个环节出了问题



能具体讲讲怎么调试跟踪么?没搞过这块,经验为0
谢谢
声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。