ホームページ  >  記事  >  バックエンド開発  >  Python は Tesseract ライブラリを使用して本人確認検証を実装します

Python は Tesseract ライブラリを使用して本人確認検証を実装します

小云云
小云云オリジナル
2018-03-29 13:31:271872ブラウズ

1. Tesseract の紹介

Tesseract は、OCR ライブラリです (OCR は、英語の Optical Character Recognition の略です)。テキスト データをスキャンし、画像ファイルを分析および処理し、テキストとレイアウト情報を取得するために使用されます。 Tesseract は現在、比較的正確な認識を備えた最高の OCR ライブラリとして認識されています。 TesserActの使用:[環境]システムをダウンロードします4 .Python スクリプトで tesseract.exe アプリケーションを導入する方法:

#根据下载安装文件的路径配置环境变量
set TESSDATA_PREFIX F:\Tesseract-OCR\

5. ケースのデモ

次の画像テキストを認識します:


pip install pytesseract

結果のデモ:


Google

注: たとえば、クロールする必要がある場合、tesseract-OCR エンジンは、そのコンテンツを識別できないことがあります。現時点では、データは検証コードを手動で入力する必要があります:


3. ログイン Zhihu ソース コードをシミュレートします


pytesseract.pytesseract.tesseract_cmd = r'F:\Tesseract-OCR\tesseract.exe'

関連する推奨事項:

Python で pytesseract を呼び出して、ウェブサイト認証コード


以上がPython は Tesseract ライブラリを使用して本人確認検証を実装しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。