ホームページ >バックエンド開発 >Python チュートリアル >Python画像テキスト認識

Python画像テキスト認識

高洛峰オリジナル: 2016-10-19 17:09:292729ブラウズ

最近思ったのですが、画像テキスト認識のツールってないのかな？私は OCR 、中国の比較的強力な Hanwang OCR を思い出しました。では、Python を使ってそれを実現できるでしょうか?そこで、この分野の PYthon の議論に関する情報を探し回ったところ、PyTesser という楽しいプログラムを発見しました。取り出して共有して議論してください:

PyTesser は、Python の光学式文字認識モジュールであり、Tesseract OCR エンジンと組み合わせて使用され、画像または画像ファイルから文字列を抽出して出力します。

PyTesser を使用するには、Tesseract OCR エンジンをインストールする必要はありませんが、最初に PIL モジュール (Python 画像ライブラリ、Python グラフィックライブラリ) をインストールする必要があります

公式紹介:

PyTesser は Python 用の光学式文字認識モジュールです. 入力として画像または画像ファイルを受け取り、文字列を出力します。

PyTesser は Tesseract OCR エンジンを使用し、画像を受け入れられる形式に変換し、Tesseract 実行可能ファイルを外部スクリプトとして呼び出します。Windows 実行可能ファイルが Python スクリプトとともに提供されます。スクリプトは他のオペレーティングシステムでも動作するはずです。

PyTesser 公式ダウンロードアドレス: http://code.google.com/p/pytesser/downloads/list

PIL ライブラリリソースアドレス: http://www.pythonware .com/products/pil/

しかし、テスト使用中に、英語コンテンツのみを認識するのが理想的だが、中国語コンテンツの認識には対応できないことがわかりました。

興味のある学生はぜひ試してみてください

声明：

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

前の記事：Python - 命名規則次の記事：Python - 命名規則

続きを見る

Python画像テキスト認識

関連記事