ホームページ >バックエンド開発 >Python チュートリアル >EasyOCR ツールを使用して Python で画像テキストを認識する方法
説明: EasyOCR は、画像からテキストを抽出するための Python モジュールです。自然シーンのテキストとドキュメントの両方を読み取ることができる汎用 OCR です。現在、80 以上の言語と、ラテン語、中国語、アラビア語、サンスクリット語、キリル語などを含むすべての一般的な筆記体をサポートしています。
EasyOCR は、PyTorch に実装された光学式文字認識 (OCR) ツールです。
説明: EasyOCR は 2 つの実行方法をサポートしています。1 つは一般的に使用される CPU で、もう 1 つは GPU サポートと CUDA 環境を必要とします。ミニプログラムでの画像認識や車両のナンバープレート認識(自動車債務管理システムなど)など、画像内の言語とテキストの認識を実行できます。
コマンド ウィンドウで、pip を使用して EasyOCR の安定バージョンをインストールします。
pip install easyocr
import easyocr reader = easyocr.Reader( ['ch_sim', 'en'], gpu=False, model_storage_directory='model/.', user_network_directory='model/.', ) result = reader.readtext('examples/chinese.jpg')
を使用して上記のコードを実行すると、検出および認識モデルがネットワーク経由で指定したディレクトリに自動的にダウンロードされます。
['ch_sim', 'en'],: 認識する言語を指定します。
gpu=False,: GPU を使用するかどうかを設定します ( EasyOCR GPU 上でより効率的に実行されます。GPU がない場合や GPU メモリが不足している場合は False を設定します)
model_storage_directory='model/.',: モデルのストレージ パスを検出して識別します(未設定の場合) デフォルトでは ~/.EasyOCR/model ディレクトリに保存されます)
認識結果result
はリストであり、リスト内の各項目は 3
認識結果の長さです。例: ([[189, 75], [469, 75], [469, 165], [189, 165]], '豫園路' 、0.3754989504814148)
、それぞれ 境界ボックス、検出されたテキスト、および confidence の値です。
EasyOCR サーバーは、画像からテキストを抽出するためのサーバーです。自然風景のテキストと文書内の密なテキストの両方を読み取ることができる汎用 OCR です。現在 80 の言語がサポートされており、さらに増加しています。
ステップ 0. GitHub から easyocr-server をダウンロードしてインストールします。
git clone https://github.com/hekaiyou/easyocr-server.git
ステップ 1. PyPI を使用して easyocr、bottle、gevent モジュールをインストールします。
cd easyocr-server pip install -r requirements.txt
python main.py
ブラウザ: http://localhost:8080/ocr/
CMD: curl http://localhost:8080/ocr/ -F " language=en" -F "img_file=@examples/english.png"
Docker によるデプロイ サービス
docker build -t easyocr-server:latest .
実行してください。
docker run -it -v {DATA_DIR}:/workspace/model -p 8083:8080 easyocr-server:latest
Language | Code Name |
---|---|
Abaza | abq |
Adyghe | ady |
Afrikaans | af |
Angika | ang |
Arabic | ar |
Assamese | as |
Avar | ava |
Azerbaijani | az |
Belarusian | be |
Bulgarian | bg |
Bihari | bh |
Bhojpuri | bho |
Bengali | bn |
Bosnian | bs |
Simplified Chinese | ch_sim |
Traditional Chinese | ch_tra |
Chechen | che |
Czech | cs |
Welsh | cy |
Danish | da |
Dargwa | dar |
German | de |
English | en |
Spanish | es |
Estonian | et |
Persian (Farsi) | fa |
French | fr |
Irish | ga |
Goan Konkani | gom |
Hindi | hi |
Croatian | hr |
Hungarian | hu |
Indonesian | id |
Ingush | inh |
Icelandic | is |
Italian | it |
Japanese | ja |
Kabardian | kbd |
Kannada | kn |
Korean | ko |
Kurdish | ku |
Latin | la |
Lak | lbe |
Lezghian | lez |
Lithuanian | lt |
Latvian | lv |
Magahi | mah |
Maithili | mai |
Maori | mi |
Mongolian | mn |
Marathi | mr |
Malay | ms |
Maltese | mt |
Nepali | ne |
Newari | new |
Dutch | nl |
Norwegian | no |
Occitan | oc |
Pali | pi |
Polish | pl |
Portuguese | pt |
Romanian | ro |
Russian | ru |
Serbian (cyrillic) | rs_cyrillic |
Serbian (latin) | rs_latin |
Nagpuri | sck |
Slovak | sk |
Slovenian | sl |
Albanian | sq |
Swedish | sv |
Swahili | sw |
Tamil | ta |
Tabassaran | tab |
Telugu | te |
Thai | th |
Tajik | tjk |
Tagalog | tl |
Turkish | tr |
Uyghur | ug |
Ukranian | uk |
Urdu | ur |
Uzbek | uz |
Vietnamese | vi |
以上がEasyOCR ツールを使用して Python で画像テキストを認識する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。