前情:這篇文章所提及的內容是博主上個暑假時候做的,一直沒有沉下心來把自己的心得寫在紙面上,所幸這個假期閒暇時候比較多,想著能寫多少是多少,於是就有了此篇。
驗證碼?我也能破解?
關於驗證碼的介紹就不多說了,各種各樣的驗證碼在人們生活中時不時就會冒出來,博主身為東北大學的學生,日常接觸最多的就是教務處系統的驗證碼了。
東大的驗證碼一直被學生吐槽,太難輸入了,不僅區分大小寫,有些時候你明明輸入正確了,卻提示出錯,而這個時候 禁止你的左鍵複製
也許該彈出來了。
(不過1python爬蟲入門級識別驗證碼-17學年度教務處更改了驗證碼的內容,更方便人類操作了。)
可以看出教務處的驗證碼十分有規律,每個字母數字的大小位置形狀等等都是固定的,這正適合毫無基礎的初學者進行驗證碼的識別。
識別辦法
模擬登陸有著複雜的步驟,在這裡咱們不管其他操作,只負責根據輸入的一張驗證碼圖片返回一個答案字串。
我們知道驗證碼為了製作幹擾,會把圖片弄成五顏六色的樣子,而我們首先就是要去除這些幹擾,這一步就需要不斷試驗了,增強圖片色彩,加大對比度等等都可以產生幫助。
在經過各種對圖片的操作之後,終於找到了比較完美的去除乾擾方案。可以看到在去除乾擾之後,最優情況下,我們將得到一張十分純淨的黑白字元圖片。一張圖片上有四個字符,沒辦法一下子就把四個字符全部識別,需要把圖片進行裁剪,裁剪成每張小圖只有一個字符的樣子,再對每張圖片分別進行識別。
接下來就是辨識文字了,我們先把得到的小圖轉換成01表示的矩陣,每個矩陣代表一個字元。
例如數字六的矩陣
num_python爬蟲入門級識別驗證碼python爬蟲入門級識別驗證碼[ 0,0,0,0,0,0,0,0,0,0,0,0,0, 0,0,0,0,0,0,0,0,0,0,0,0,0, 0,0,0,0,0,1,1,0,0,0,0,0,0, 0,0,0,0,1,1,1,0,0,0,0,0,0, 0,0,0,1,1,1,0,0,0,0,0,0,0, 0,0,0,1,1,0,0,0,0,0,0,0,0, 0,0,1,1,0,0,0,0,0,0,0,0,0, 0,0,1,1,0,0,0,0,0,0,0,0,0, 0,1,1,1,1,1,1,1,0,0,0,0,0, 0,1,1,1,1,1,1,1,1,0,0,0,0, 0,1,1,0,0,0,0,1,1,1,0,0,0, 0,1,1,0,0,0,0,0,1,1,0,0,0, 0,1,1,0,0,0,0,0,1,1,0,0,0, 0,1,1,1,0,0,0,1,1,1,0,0,0, 0,0,1,1,1,1,1,1,1,0,0,0,0, 0,0,0,1,1,1,1,1,0,0,0,0,0, 0,0,0,0,0,0,0,0,0,0,0,0,0, 0,0,0,0,0,0,0,0,0,0,0,0,0, 0,0,0,0,0,0,0,0,0,0,0,0,0, 0,0,0,0,0,0,0,0,0,0,0,0,0, ]
遠遠望過去,瞇著眼睛還是能分辨出來的。
因為東大教務處的驗證碼十分規整,每個數字所在的位置都是固定的,所以並不需要涉及什麼機器學習的演算法,只是簡單的進行一下矩陣的比對就可以了,在所有的實現做好的矩陣中找到相似度最高的矩陣就可以了,這裡的比對方法多種多樣,反正數據簡單能正確辨識出來就好。
至此,咱們的驗證碼識別工作就結束了。

Python适合数据科学、Web开发和自动化任务,而C 适用于系统编程、游戏开发和嵌入式系统。Python以简洁和强大的生态系统著称,C 则以高性能和底层控制能力闻名。

2小時內可以學會Python的基本編程概念和技能。 1.學習變量和數據類型,2.掌握控制流(條件語句和循環),3.理解函數的定義和使用,4.通過簡單示例和代碼片段快速上手Python編程。

Python在web開發、數據科學、機器學習、自動化和腳本編寫等領域有廣泛應用。 1)在web開發中,Django和Flask框架簡化了開發過程。 2)數據科學和機器學習領域,NumPy、Pandas、Scikit-learn和TensorFlow庫提供了強大支持。 3)自動化和腳本編寫方面,Python適用於自動化測試和系統管理等任務。

兩小時內可以學到Python的基礎知識。 1.學習變量和數據類型,2.掌握控制結構如if語句和循環,3.了解函數的定義和使用。這些將幫助你開始編寫簡單的Python程序。

如何在10小時內教計算機小白編程基礎?如果你只有10個小時來教計算機小白一些編程知識,你會選擇教些什麼�...

使用FiddlerEverywhere進行中間人讀取時如何避免被檢測到當你使用FiddlerEverywhere...

Python3.6環境下加載Pickle文件報錯:ModuleNotFoundError:Nomodulenamed...

如何解決jieba分詞在景區評論分析中的問題?當我們在進行景區評論分析時,往往會使用jieba分詞工具來處理文�...


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

Atom編輯器mac版下載
最受歡迎的的開源編輯器

ZendStudio 13.5.1 Mac
強大的PHP整合開發環境

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

WebStorm Mac版
好用的JavaScript開發工具

Safe Exam Browser
Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。