ホームページ >バックエンド開発 >Python チュートリアル >Python画像テキスト認識
最近思ったのですが、画像テキスト認識のツールってないのかな?私は OCR 、中国の比較的強力な Hanwang OCR を思い出しました。では、Python を使ってそれを実現できるでしょうか?そこで、この分野の PYthon の議論に関する情報を探し回ったところ、PyTesser という楽しいプログラムを発見しました。取り出して共有して議論してください:
PyTesser は、Python の光学式文字認識モジュールであり、Tesseract OCR エンジンと組み合わせて使用され、画像または画像ファイルから文字列を抽出して出力します。
PyTesser を使用するには、Tesseract OCR エンジンをインストールする必要はありませんが、最初に PIL モジュール (Python 画像ライブラリ、Python グラフィック ライブラリ) をインストールする必要があります
公式紹介:
PyTesser は Python 用の光学式文字認識モジュールです. 入力として画像または画像ファイルを受け取り、文字列を出力します。
PyTesser は Tesseract OCR エンジンを使用し、画像を受け入れられる形式に変換し、Tesseract 実行可能ファイルを外部スクリプトとして呼び出します。Windows 実行可能ファイルが Python スクリプトとともに提供されます。スクリプトは他のオペレーティング システムでも動作するはずです。
PyTesser 公式ダウンロード アドレス: http://code.google.com/p/pytesser/downloads/list
PIL ライブラリ リソース アドレス: http://www.pythonware .com/products/pil/
しかし、テスト使用中に、英語コンテンツのみを認識するのが理想的だが、中国語コンテンツの認識には対応できないことがわかりました。
興味のある学生はぜひ試してみてください