ホームページ  >  記事  >  バックエンド開発  >  EasyOCR ツールを使用して Python で画像テキストを認識する方法

EasyOCR ツールを使用して Python で画像テキストを認識する方法

WBOY
WBOY転載
2023-04-30 09:40:062435ブラウズ

EasyOCR とは?

説明: EasyOCR は、画像からテキストを抽出するための Python モジュールです。自然シーンのテキストとドキュメントの両方を読み取ることができる汎用 OCR です。現在、80 以上の言語と、ラテン語、中国語、アラビア語、サンスクリット語、キリル語などを含むすべての一般的な筆記体をサポートしています。

EasyOCR は、PyTorch に実装された光学式文字認識 (OCR) ツールです。

Q: EasyOCR で何ができますか?

説明: EasyOCR は 2 つの実行方法をサポートしています。1 つは一般的に使用される CPU で、もう 1 つは GPU サポートと CUDA 環境を必要とします。ミニプログラムでの画像認識や車両のナンバープレート認識(自動車債務管理システムなど)など、画像内の言語とテキストの認識を実行できます。

EasyOCR のインストール

コマンド ウィンドウで、pip を使用して EasyOCR の安定バージョンをインストールします。

pip install easyocr

EasyOCR

import easyocr

reader = easyocr.Reader(
    ['ch_sim', 'en'],
    gpu=False,
    model_storage_directory='model/.',
    user_network_directory='model/.',
)
result = reader.readtext('examples/chinese.jpg')

を使用して上記のコードを実行すると、検出および認識モデルがネットワーク経由で指定したディレクトリに自動的にダウンロードされます。

  • ['ch_sim', 'en'],: 認識する言語を指定します。

  • gpu=False,: GPU を使用するかどうかを設定します ( EasyOCR GPU 上でより効率的に実行されます。GPU がない場合や GPU メモリが不足している場合は False を設定します)

  • model_storage_directory='model/.',: モデルのストレージ パスを検出して識別します(未設定の場合) デフォルトでは ~/.EasyOCR/model ディレクトリに保存されます)

認識結果resultはリストであり、リスト内の各項目は 3 認識結果の長さです。例: ([[189, 75], [469, 75], [469, 165], [189, 165]], '豫園路' 、0.3754989504814148)、それぞれ 境界ボックス検出されたテキスト、および confidence の値です。

easyocr-server

EasyOCR サーバーは、画像からテキストを抽出するためのサーバーです。自然風景のテキストと文書内の密なテキストの両方を読み取ることができる汎用 OCR です。現在 80 の言語がサポートされており、さらに増加し​​ています。

インストール手順

ステップ 0. GitHub から easyocr-server をダウンロードしてインストールします。

git clone https://github.com/hekaiyou/easyocr-server.git

ステップ 1. PyPI を使用して easyocr、bottle、gevent モジュールをインストールします。

cd easyocr-server
pip install -r requirements.txt

インストールの確認

python main.py
  • ブラウザ: http://localhost:8080/ocr/

  • CMD: curl http://localhost:8080/ocr/ -F " language=en" -F "img_file=@examples/english.png"

  • ##検証が成功すると、印刷された推論結果をブラウザで確認できるようになります。

EasyOCR ツールを使用して Python で画像テキストを認識する方法Docker によるデプロイ サービス

イメージを構築するための Dockerfile を提供します。

docker build -t easyocr-server:latest .

実行してください。

docker run -it -v {DATA_DIR}:/workspace/model -p 8083:8080 easyocr-server:latest
Language Code Name
Abaza abq
Adyghe ady
Afrikaans af
Angika ang
Arabic ar
Assamese as
Avar ava
Azerbaijani az
Belarusian be
Bulgarian bg
Bihari bh
Bhojpuri bho
Bengali bn
Bosnian bs
Simplified Chinese ch_sim
Traditional Chinese ch_tra
Chechen che
Czech cs
Welsh cy
Danish da
Dargwa dar
German de
English en
Spanish es
Estonian et
Persian (Farsi) fa
French fr
Irish ga
Goan Konkani gom
Hindi hi
Croatian hr
Hungarian hu
Indonesian id
Ingush inh
Icelandic is
Italian it
Japanese ja
Kabardian kbd
Kannada kn
Korean ko
Kurdish ku
Latin la
Lak lbe
Lezghian lez
Lithuanian lt
Latvian lv
Magahi mah
Maithili mai
Maori mi
Mongolian mn
Marathi mr
Malay ms
Maltese mt
Nepali ne
Newari new
Dutch nl
Norwegian no
Occitan oc
Pali pi
Polish pl
Portuguese pt
Romanian ro
Russian ru
Serbian (cyrillic) rs_cyrillic
Serbian (latin) rs_latin
Nagpuri sck
Slovak sk
Slovenian sl
Albanian sq
Swedish sv
Swahili sw
Tamil ta
Tabassaran tab
Telugu te
Thai th
Tajik tjk
Tagalog tl
Turkish tr
Uyghur ug
Ukranian uk
Urdu ur
Uzbek uz
Vietnamese vi

以上がEasyOCR ツールを使用して Python で画像テキストを認識する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はyisu.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。