1. Tesseract の紹介
Tesseract は、OCR ライブラリです (OCR は、英語の Optical Character Recognition の略です)。テキスト データをスキャンし、画像ファイルを分析および処理し、テキストとレイアウト情報を取得するために使用されます。 Tesseract は現在、比較的正確な認識を備えた最高の OCR ライブラリとして認識されています。 TesserActの使用:[環境]システムをダウンロードします4 .Python スクリプトで tesseract.exe アプリケーションを導入する方法:
#根据下载安装文件的路径配置环境变量 set TESSDATA_PREFIX F:\Tesseract-OCR\5. ケースのデモ 次の画像テキストを認識します:
pip install pytesseract結果のデモ:
注: たとえば、クロールする必要がある場合、tesseract-OCR エンジンは、そのコンテンツを識別できないことがあります。現時点では、データは検証コードを手動で入力する必要があります:
pytesseract.pytesseract.tesseract_cmd = r'F:\Tesseract-OCR\tesseract.exe'関連する推奨事項:
Python で pytesseract を呼び出して、ウェブサイト認証コード
以上がPython は Tesseract ライブラリを使用して本人確認検証を実装しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。