Python画像テキスト認識

高洛峰
高洛峰オリジナル
2016-10-19 17:09:292661ブラウズ

最近思ったのですが、画像テキスト認識のツールってないのかな?私は OCR 、中国の比較的強力な Hanwang OCR を思い出しました。では、Python を使ってそれを実現できるでしょうか?そこで、この分野の PYthon の議論に関する情報を探し回ったところ、PyTesser という楽しいプログラムを発見しました。取り出して共有して議論してください:

PyTesser は、Python の光学式文字認識モジュールであり、Tesseract OCR エンジンと組み合わせて使用​​され、画像または画像ファイルから文字列を抽出して出力します。

PyTesser を使用するには、Tesseract OCR エンジンをインストールする必要はありませんが、最初に PIL モジュール (Python 画像ライブラリ、Python グラフィック ライブラリ) をインストールする必要があります

公式紹介:

PyTesser は Python 用の光学式文字認識モジュールです. 入力として画像または画像ファイルを受け取り、文字列を出力します。

PyTesser は Tesseract OCR エンジンを使用し、画像を受け入れられる形式に変換し、Tesseract 実行可能ファイルを外部スクリプトとして呼び出します。Windows 実行可能ファイルが Python スクリプトとともに提供されます。スクリプトは他のオペレーティング システムでも動作するはずです。

PyTesser 公式ダウンロード アドレス: http://code.google.com/p/pytesser/downloads/list

PIL ライブラリ リソース アドレス: http://www.pythonware .com/products/pil/

しかし、テスト使用中に、英語コンテンツのみを認識するのが理想的だが、中国語コンテンツの認識には対応できないことがわかりました。

興味のある学生はぜひ試してみてください


声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
前の記事:Python - 命名規則次の記事:Python - 命名規則