Heim >Backend-Entwicklung >Python-Tutorial >So verwenden Sie das EasyOCR-Tool zum Erkennen von Bildtext in Python
Beschreibung: EasyOCR ist ein Python-Modul zum Extrahieren von Text aus Bildern. Es handelt sich um eine Allzweck-OCR, die sowohl natürlichen Szenentext als auch dichten Text in Dokumenten lesen kann. Unterstützt derzeit über 80 Sprachen und alle gängigen Schreibskripte, darunter: Latein, Chinesisch, Arabisch, Sanskrit, Kyrillisch und mehr.
EasyOCR ist ein in PyTorch implementiertes Tool zur optischen Zeichenerkennung (OCR).
Beschreibung: EasyOCR unterstützt zwei Ausführungsarten, eine ist eine häufig verwendete CPU und die andere erfordert GPU-Unterstützung und CUDA-Anforderungen In einer zu installierenden Umgebung können wir damit die Sprach- und Texterkennung in Bildern durchführen, z. B. die Bilderkennung in Miniprogrammen und die Erkennung von Fahrzeugkennzeichen (z. B. Autoschuldenverwaltungssystem).
Im Befehlsfenster verwenden Sie pip, um die stabile Version von EasyOCR zu installieren.
pip install easyocr
import easyocr reader = easyocr.Reader( ['ch_sim', 'en'], gpu=False, model_storage_directory='model/.', user_network_directory='model/.', ) result = reader.readtext('examples/chinese.jpg')
Wenn Sie den obigen Code ausführen, wird das Erkennungs- und Erkennungsmodell automatisch über das Netzwerk in das angegebene Verzeichnis heruntergeladen.
['ch_sim', 'en'],: Geben Sie die erkannte Sprache an
gpu=False ,: Legen Sie fest, ob die GPU verwendet werden soll (EasyOCR läuft effizienter auf der GPU, legen Sie „Falsch“ fest, wenn keine GPU vorhanden ist oder nicht genügend GPU-Speicher vorhanden ist)
model_storage_directory='model/.' , : Der Speicherpfad des Erkennungs- und Erkennungsmodells (der Standardwert wird im Verzeichnis ~/.EasyOCR/model gespeichert, falls nicht festgelegt)
Erkennungsergebnis result
Ja Eine Liste, jedes Element in der Liste ist ein Erkennungsergebnis mit einer Länge von 3
, wie zum Beispiel ([[189, 75], [469, 75], [469, 165], [189, 165]], 'Yuyuan Road', 0.3754989504814148)
, die Bounding Box, Erkannter Text und sind Vertrauen bzw. Wert. result
是一个列表,列表中的每一项都是一个长度为 3
的识别结果,例如 ([[189, 75], [469, 75], [469, 165], [189, 165]], '愚园路', 0.3754989504814148)
,它们分别是 边界框、检测到的文本 和 置信度 值。
EasyOCR 服务器是一个用于从图像中提取文本。它是一种通用的 OCR,既可以读取自然场景文本,也可以读取文档中的密集文本。目前支持 80+ 种语言,并且还在扩展。
步骤 0. 从 GitHub 下载 easyocr-server 并安装。
git clone https://github.com/hekaiyou/easyocr-server.git
步骤 1. 使用 PyPI 安装 easyocr、 bottle 和 gevent 模块。
cd easyocr-server pip install -r requirements.txt
python main.py
Browser: http://localhost:8080/ocr/
CMD: curl http://localhost:8080/ocr/ -F "language=en" -F "img_file=@examples/english.png"
Schritt 0. Laden Sie easyocr-server von GitHub herunter und installieren Sie es.
docker build -t easyocr-server:latest .
docker run -it -v {DATA_DIR}:/workspace/model -p 8083:8080 easyocr-server:latest
Installation überprüfen
rrreee#🎜🎜#Browser: http://localhost:8080/ocr/#🎜🎜 ##🎜🎜##🎜🎜##🎜🎜#CMD:curl http://localhost:8080/ocr/ -F "sprache=en" -F "img_file=@examples /english.png"
#🎜🎜##🎜🎜##🎜🎜##🎜🎜#Nach erfolgreicher Überprüfung sollten Sie die gedruckten Inferenzergebnisse im Browser sehen können. #🎜🎜##🎜🎜##🎜🎜##🎜🎜##🎜🎜# Bereitstellung des Dienstes über Docker #🎜🎜##🎜🎜# Wir stellen eine Docker-Datei zum Erstellen des Images bereit. #🎜🎜#rrreee#🎜🎜#Führen Sie es aus. #🎜🎜#docker run -it -v {DATA_DIR}:/workspace/model -p 8083:8080 easyocr-server:latest
Language | Code Name |
---|---|
Abaza | abq |
Adyghe | ady |
Afrikaans | af |
Angika | ang |
Arabic | ar |
Assamese | as |
Avar | ava |
Azerbaijani | az |
Belarusian | be |
Bulgarian | bg |
Bihari | bh |
Bhojpuri | bho |
Bengali | bn |
Bosnian | bs |
Simplified Chinese | ch_sim |
Traditional Chinese | ch_tra |
Chechen | che |
Czech | cs |
Welsh | cy |
Danish | da |
Dargwa | dar |
German | de |
English | en |
Spanish | es |
Estonian | et |
Persian (Farsi) | fa |
French | fr |
Irish | ga |
Goan Konkani | gom |
Hindi | hi |
Croatian | hr |
Hungarian | hu |
Indonesian | id |
Ingush | inh |
Icelandic | is |
Italian | it |
Japanese | ja |
Kabardian | kbd |
Kannada | kn |
Korean | ko |
Kurdish | ku |
Latin | la |
Lak | lbe |
Lezghian | lez |
Lithuanian | lt |
Latvian | lv |
Magahi | mah |
Maithili | mai |
Maori | mi |
Mongolian | mn |
Marathi | mr |
Malay | ms |
Maltese | mt |
Nepali | ne |
Newari | new |
Dutch | nl |
Norwegian | no |
Occitan | oc |
Pali | pi |
Polish | pl |
Portuguese | pt |
Romanian | ro |
Russian | ru |
Serbian (cyrillic) | rs_cyrillic |
Serbian (latin) | rs_latin |
Nagpuri | sck |
Slovak | sk |
Slovenian | sl |
Albanian | sq |
Swedish | sv |
Swahili | sw |
Tamil | ta |
Tabassaran | tab |
Telugu | te |
Thai | th |
Tajik | tjk |
Tagalog | tl |
Turkish | tr |
Uyghur | ug |
Ukranian | uk |
Urdu | ur |
Uzbek | uz |
Vietnamese | vi |
Das obige ist der detaillierte Inhalt vonSo verwenden Sie das EasyOCR-Tool zum Erkennen von Bildtext in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!