ホームページ  >  記事  >  バックエンド開発  >  Python コードは画像テキスト認識を実装します

Python コードは画像テキスト認識を実装します

零到壹度
零到壹度オリジナル
2018-04-02 14:12:092692ブラウズ

この記事は、画像テキスト認識を実装するための Python コードを共有します。その内容は、困っている友人に役立つことを願っています

必要な画像を例に挙げます。認識するには

Python コードは画像テキスト認識を実装します

まずレンダリングを見てみましょう

Python コードは画像テキスト認識を実装します コードを実行した後の認識結果は、正しく認識されない単語がいくつかありますが、ほとんどの単語は認識できます。

风急天高猿啸哀 渚芸胄芳少白鸟飞凤
无边落木萧萧下, 不尽长量工盲衮宕衮来
万里悲秋常1乍窨, 百年多病独登氤
艰难苦恨擎霜量 漂倒新停澍酉帆

1 行のコードで画像を認識できますが、舞台裏でいくつかの準備作業を行う必要があります

  • ここでは、pytesseract と PIL の 2 つのライブラリを使用する必要があります

  • 同時に、認識エンジン tesseract-ocr

これらのライブラリのインストールについて話しましょう。これらのライブラリがインストールされて初めて、Python は 1 行のコードで画像とテキストの認識を実現できるからです

まず、pytesseract と PIL のインストールです

これら 2 つのパッケージは、pip を使用してインストールできます

- 1. コマンド ライン インストール
pip install PIL
pip install pytesseract
- 2. pycharm エディターを使用する場合は、pycharm を直接使用して迅速にインストールできます。
pycharm の設定ページで次の手順に従ってください

Python コードは画像テキスト認識を実装しますこのようにして、PIL をインストールするには、上記の 3 番目の手順で PIL を検索し、[インストール] をクリックするだけです

Python コードは画像テキスト認識を実装します

これで、ライブラリをインストールし、次のコードを実行すると

from PIL import Image
import pytesseract
text=pytesseract.image_to_string(Image.open('denggao.jpeg'),lang='chi_sim')
print(text)

、次のエラーが報告されます。エラーの理由は、認識エンジン tesseract-ocr がインストールされていません

Python コードは画像テキスト認識を実装します

次に、認識エンジン tesseract-ocr をインストールします

  • 1. 以下のインストール パッケージをダウンロードし、直接クリックしてインストールします

    tesseract-ocr インストール パッケージと中国語パッケージ

tesseract-ocr を解凍してインストールし、中国語の認識をサポートするには次の手順を実行します。 tesseract-ocr はデフォルトでは中国語の認識をサポートしていないためです。


Python コードは画像テキスト認識を実装します

  • 2. tesseract-ocrをインストールした後、いくつかの設定を行う必要があります

    C:UsershuxiuAppDataLocalProgramsPythonPython35Libsite-packagespytesseractでpytesseract.pyを見つけて開き、次の操作を実行します

  • # CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
    #tesseract_cmd = 'tesseract'
    tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'
すぐに開くこともできますpycharm を介して pytesseract を実行します。これで、次のコードを実行して、Du Fu の Ascension をテキストに解析します。

以上がPython コードは画像テキスト認識を実装しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。