代码如下:
<code><?php header("Content-type:text/html;charset=utf-8"); /** * 模拟登录 */ //1.初始化变量 $cookie_file = tempnam('./temp','cookie'); $login_url = "http://210.32.33.91:8080/reader/redr_verify.php";//登录页面 $verify_code_url = "http://210.32.33.91:8080/reader/captcha.php";//验证码页面 //2.获取cookies echo "正在获取COOKIE...<br>"; $curl = curl_init(); $timeout = 5; curl_setopt($curl, CURLOPT_URL, $login_url); curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); curl_setopt($curl, CURLOPT_CONNECTTIMEOUT, $timeout); curl_setopt($curl,CURLOPT_COOKIEJAR,$cookie_file); //获取COOKIE并存储 $contents = curl_exec($curl); curl_close($curl); //3.取出验证码 echo "COOKIE获取完成,正在取验证码...<br>"; $curl = curl_init(); curl_setopt($curl, CURLOPT_URL, $verify_code_url); curl_setopt($curl, CURLOPT_COOKIEJAR, $cookie_file);//保存cookie curl_setopt($curl, CURLOPT_COOKIEFILE, $cookie_file);//使用cookie curl_setopt($curl, CURLOPT_HEADER, 0); curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); $img = curl_exec($curl); curl_close($curl); $codename = time(); $fp = fopen("/home/wwwroot/default/tesseract/Test/images/$codename.png","w"); echo "<img src="/static/imghwm/default1.png" data-src="/img/bVssL8" class="lazy" alt="php中使用tesseract识别验证码,并且模拟登录,验证码错误" >"; fwrite($fp,$img); fclose($fp); //开始识别验证码 echo "验证码取出完成,正在休眠,正在识别验证码...<br>"; passthru("/usr/bin/tesseract /home/wwwroot/default/tesseract/Test/images/$codename.png /home/wwwroot/default/tesseract/Test/images/$codename"); $code = file_get_contents("./images/$codename.txt"); echo "验证码成功取出:$code<br>"; echo "正在准备模拟登录...<br>"; $post_url = "http://210.32.33.91:8080/reader/redr_verify.php"; //为安全性,此处密码不提供。 $post = "number=1111111&passwd=111111&captcha=$code&select=cert_no&returnUrl="; $curl = curl_init(); curl_setopt($curl, CURLOPT_URL, $post_url); curl_setopt($curl, CURLOPT_HEADER, false); curl_setopt($curl, CURLOPT_RETURNTRANSFER,1); curl_setopt($curl, CURLOPT_POSTFIELDS, $post); curl_setopt($curl, CURLOPT_COOKIEJAR, $cookie_file); curl_setopt($curl, CURLOPT_COOKIEFILE, $cookie_file); $result=curl_exec($curl); curl_close($curl); echo str_replace('captcha.php','http://210.32.33.91:8080/reader/captcha.php',$result);</code>
回复内容:
代码如下:
<code><?php header("Content-type:text/html;charset=utf-8"); /** * 模拟登录 */ //1.初始化变量 $cookie_file = tempnam('./temp','cookie'); $login_url = "http://210.32.33.91:8080/reader/redr_verify.php";//登录页面 $verify_code_url = "http://210.32.33.91:8080/reader/captcha.php";//验证码页面 //2.获取cookies echo "正在获取COOKIE...<br>"; $curl = curl_init(); $timeout = 5; curl_setopt($curl, CURLOPT_URL, $login_url); curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); curl_setopt($curl, CURLOPT_CONNECTTIMEOUT, $timeout); curl_setopt($curl,CURLOPT_COOKIEJAR,$cookie_file); //获取COOKIE并存储 $contents = curl_exec($curl); curl_close($curl); //3.取出验证码 echo "COOKIE获取完成,正在取验证码...<br>"; $curl = curl_init(); curl_setopt($curl, CURLOPT_URL, $verify_code_url); curl_setopt($curl, CURLOPT_COOKIEJAR, $cookie_file);//保存cookie curl_setopt($curl, CURLOPT_COOKIEFILE, $cookie_file);//使用cookie curl_setopt($curl, CURLOPT_HEADER, 0); curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); $img = curl_exec($curl); curl_close($curl); $codename = time(); $fp = fopen("/home/wwwroot/default/tesseract/Test/images/$codename.png","w"); echo "<img src="/static/imghwm/default1.png" data-src="/img/bVssL8" class="lazy" alt="php中使用tesseract识别验证码,并且模拟登录,验证码错误" >"; fwrite($fp,$img); fclose($fp); //开始识别验证码 echo "验证码取出完成,正在休眠,正在识别验证码...<br>"; passthru("/usr/bin/tesseract /home/wwwroot/default/tesseract/Test/images/$codename.png /home/wwwroot/default/tesseract/Test/images/$codename"); $code = file_get_contents("./images/$codename.txt"); echo "验证码成功取出:$code<br>"; echo "正在准备模拟登录...<br>"; $post_url = "http://210.32.33.91:8080/reader/redr_verify.php"; //为安全性,此处密码不提供。 $post = "number=1111111&passwd=111111&captcha=$code&select=cert_no&returnUrl="; $curl = curl_init(); curl_setopt($curl, CURLOPT_URL, $post_url); curl_setopt($curl, CURLOPT_HEADER, false); curl_setopt($curl, CURLOPT_RETURNTRANSFER,1); curl_setopt($curl, CURLOPT_POSTFIELDS, $post); curl_setopt($curl, CURLOPT_COOKIEJAR, $cookie_file); curl_setopt($curl, CURLOPT_COOKIEFILE, $cookie_file); $result=curl_exec($curl); curl_close($curl); echo str_replace('captcha.php','http://210.32.33.91:8080/reader/captcha.php',$result);</code>
2016/1/25 14:51更新
Linux的话captcha目录,cookies目录给写权限
你一步步断点调试,看你那个程序生成的结果是多少,图片是多少,
代码在:https://github.com/rainwsy/sf/tree/master/library-OCR-login
更新:
你应该
1.将验证码存下来,跟文字结果对比下,
2.对比每次的session_id是否一致
3.CURLOPT_COOKIEJAR第一次用的时候存session_id就可以了,后面的操作用CURLOPT_COOKIEFILE来读取session_id,其实你可以对比下几次请求返回header头中的session_id是否一致
我的验证码识别结果:
写了个DEMO:
指出几个问题,获取session在获取验证码的那一步一并获取就OK,没必要先取得session再取验证码,
当看到账号密码隐藏的时候我再想这是给校友回答的吗?
<code><?php require_once 'OCR.php'; $loginUrl = "http://210.32.33.91:8080/reader/redr_verify.php"; // 登录页面 $captchaUrl = "http://210.32.33.91:8080/reader/captcha.php"; // 验证码页面 $cookie_file = __DIR__ . DIRECTORY_SEPARATOR . 'cookies' . DIRECTORY_SEPARATOR . date('YmdHis') . '.txt'; // 获取验证码 $captchaString = get($captchaUrl, $cookie_file, true); $tempCaptchaFile = __DIR__ . DIRECTORY_SEPARATOR . 'captcha' . DIRECTORY_SEPARATOR . date('YmdHis') . '.gif'; file_put_contents($tempCaptchaFile, $captchaString); /*既然你说不是验证码的问题,我就不发出来了*/ $ocr = new OCR($tempCaptchaFile); $captcha = $ocr->getCaptcha(); /* 开始登陆 */ $username = '用户名'; $passwd = '密码'; $postArray = [ 'number' => $username, 'passwd' => $passwd, 'captcha' => $captcha, 'select' => 'cert_no', 'returnUrl' => '' ]; $postData = http_build_query($postArray); echo post($loginUrl, $postData, $cookie_file); function get($url, $cookie_file, $isCookiesSave = false) { // 初始化 $curl = curl_init($url); $header = array(); $header[] = 'User-Agent: Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36'; curl_setopt($curl, CURLOPT_HTTPHEADER, $header); // 不输出header头信息 curl_setopt($curl, CURLOPT_HEADER, 0); if ($isCookiesSave) { curl_setopt($curl, CURLOPT_COOKIEJAR, $cookie_file); // 存储cookies } else { curl_setopt($curl, CURLOPT_COOKIEFILE, $cookie_file); } // 保存到字符串而不是输出 curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); // 是否抓取跳转后的页面 curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1); $info = curl_exec($curl); curl_close($curl); return $info; } function post($url, $data, $cookie_file) { // 初始化 $curl = curl_init($url); $header = array(); $header[] = 'User-Agent: Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36'; curl_setopt($curl, CURLOPT_HTTPHEADER, $header); // 不输出header头信息 curl_setopt($curl, CURLOPT_HEADER, 0); // 保存到字符串而不是输出 curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); curl_setopt($curl, CURLOPT_COOKIEFILE, $cookie_file); // post数据 curl_setopt($curl, CURLOPT_POST, 1); // 请求数据 curl_setopt($curl, CURLOPT_POSTFIELDS, $data); // 是否抓取跳转后的页面 curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1); $response = curl_exec($curl); curl_close($curl); return $response; }</code>
网上的评论是 识别率低

在PHP中,trait適用於需要方法復用但不適合使用繼承的情況。 1)trait允許在類中復用方法,避免多重繼承複雜性。 2)使用trait時需注意方法衝突,可通過insteadof和as關鍵字解決。 3)應避免過度使用trait,保持其單一職責,以優化性能和提高代碼可維護性。

依賴注入容器(DIC)是一種管理和提供對象依賴關係的工具,用於PHP項目中。 DIC的主要好處包括:1.解耦,使組件獨立,代碼易維護和測試;2.靈活性,易替換或修改依賴關係;3.可測試性,方便注入mock對象進行單元測試。

SplFixedArray在PHP中是一種固定大小的數組,適用於需要高性能和低內存使用量的場景。 1)它在創建時需指定大小,避免動態調整帶來的開銷。 2)基於C語言數組,直接操作內存,訪問速度快。 3)適合大規模數據處理和內存敏感環境,但需謹慎使用,因其大小固定。

PHP通過$\_FILES變量處理文件上傳,確保安全性的方法包括:1.檢查上傳錯誤,2.驗證文件類型和大小,3.防止文件覆蓋,4.移動文件到永久存儲位置。

JavaScript中處理空值可以使用NullCoalescingOperator(??)和NullCoalescingAssignmentOperator(??=)。 1.??返回第一個非null或非undefined的操作數。 2.??=將變量賦值為右操作數的值,但前提是該變量為null或undefined。這些操作符簡化了代碼邏輯,提高了可讀性和性能。

CSP重要因為它能防範XSS攻擊和限制資源加載,提升網站安全性。 1.CSP是HTTP響應頭的一部分,通過嚴格策略限制惡意行為。 2.基本用法是只允許從同源加載資源。 3.高級用法可設置更細粒度的策略,如允許特定域名加載腳本和样式。 4.使用Content-Security-Policy-Report-Only頭部可調試和優化CSP策略。

HTTP請求方法包括GET、POST、PUT和DELETE,分別用於獲取、提交、更新和刪除資源。 1.GET方法用於獲取資源,適用於讀取操作。 2.POST方法用於提交數據,常用於創建新資源。 3.PUT方法用於更新資源,適用於完整更新。 4.DELETE方法用於刪除資源,適用於刪除操作。

HTTPS是一種在HTTP基礎上增加安全層的協議,主要通過加密數據保護用戶隱私和數據安全。其工作原理包括TLS握手、證書驗證和加密通信。實現HTTPS時需注意證書管理、性能影響和混合內容問題。


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

記事本++7.3.1
好用且免費的程式碼編輯器

Dreamweaver CS6
視覺化網頁開發工具

Atom編輯器mac版下載
最受歡迎的的開源編輯器

SublimeText3漢化版
中文版,非常好用