Maison >développement back-end >Tutoriel Python >Comment utiliser l'outil EasyOCR pour reconnaître le texte d'une image en Python
Description : EasyOCR est un module Python permettant d'extraire du texte à partir d'images. Il s'agit d'un OCR à usage général qui peut lire à la fois le texte d'une scène naturelle et le texte dense dans les documents. Prend actuellement en charge plus de 80 langues et tous les scripts d'écriture populaires, notamment : le latin, le chinois, l'arabe, le sanskrit, le cyrillique, etc.
EasyOCR est un outil de reconnaissance optique de caractères (OCR) implémenté dans PyTorch.
Description : EasyOCR prend en charge deux modes de fonctionnement, l'un est un processeur couramment utilisé et l'autre nécessite la prise en charge du GPU et l'environnement CUDA doit être installé. langue et texte dans les images, comme la reconnaissance d'images et la reconnaissance de plaques d'immatriculation de véhicules dans des mini-programmes (par exemple, un système de gestion des dettes automobiles).
Dans la fenêtre de commande, utilisez pip pour installer la version stable d'EasyOCR.
pip install easyocr
import easyocr reader = easyocr.Reader( ['ch_sim', 'en'], gpu=False, model_storage_directory='model/.', user_network_directory='model/.', ) result = reader.readtext('examples/chinese.jpg')
pour exécuter le code ci-dessus, le modèle de détection et de reconnaissance sera automatiquement téléchargé dans le répertoire spécifié via le réseau.
['ch_sim', 'en'], : Spécifiez la langue reconnue
gpu=False, : Définissez s'il faut utiliser le GPU (EasyOCR fonctionne plus efficacement sur le GPU, défini lorsqu'il n'y a pas de GPU ou un GPU insuffisant mémoire) Faux)
model_storage_directory='model/.', : Le chemin de stockage du modèle de détection et de reconnaissance (la valeur par défaut est stockée dans le répertoire ~/.EasyOCR/model lorsqu'elle n'est pas définie)
Résultats de la reconnaissance result
est une liste, chaque élément de la liste est un résultat de reconnaissance d'une longueur de 3
, tel que ([[189, 75], [469, 75], [469, 165 ], [189, 165]], 'Yuyuan Road', 0.3754989504814148)
, qui sont un cadre de délimitation, un texte détecté et Valeur de confiance. result
是一个列表,列表中的每一项都是一个长度为 3
的识别结果,例如 ([[189, 75], [469, 75], [469, 165], [189, 165]], '愚园路', 0.3754989504814148)
,它们分别是 边界框、检测到的文本 和 置信度 值。
EasyOCR 服务器是一个用于从图像中提取文本。它是一种通用的 OCR,既可以读取自然场景文本,也可以读取文档中的密集文本。目前支持 80+ 种语言,并且还在扩展。
步骤 0. 从 GitHub 下载 easyocr-server 并安装。
git clone https://github.com/hekaiyou/easyocr-server.git
步骤 1. 使用 PyPI 安装 easyocr、 bottle 和 gevent 模块。
cd easyocr-server pip install -r requirements.txt
python main.py
Browser: http://localhost:8080/ocr/
CMD: curl http://localhost:8080/ocr/ -F "language=en" -F "img_file=@examples/english.png"
Étape 0. Téléchargez easyocr-server depuis GitHub et installez-le.
docker build -t easyocr-server:latest .
docker run -it -v {DATA_DIR}:/workspace/model -p 8083:8080 easyocr-server:latest
Vérifier l'installation
rrreee🎜Navigateur : http://localhost:8080/ocr/🎜🎜🎜🎜CMD :curl http:// localhost:8080/ocr/ -F "langue=en" -F "img_file=@examples/english.png"
🎜🎜🎜🎜Après une vérification réussie, vous devriez pouvoir voir les résultats d'inférence imprimés dans le navigateur . 🎜🎜🎜🎜🎜Service de déploiement via Docker🎜🎜Nous fournissons un Dockerfile pour construire l'image. 🎜rrreee🎜Exécutez-le. 🎜docker run -it -v {DATA_DIR}:/workspace/model -p 8083:8080 easyocr-server:latest
Language | Code Name |
---|---|
Abaza | abq |
Adyghe | ady |
Afrikaans | af |
Angika | ang |
Arabic | ar |
Assamese | as |
Avar | ava |
Azerbaijani | az |
Belarusian | be |
Bulgarian | bg |
Bihari | bh |
Bhojpuri | bho |
Bengali | bn |
Bosnian | bs |
Simplified Chinese | ch_sim |
Traditional Chinese | ch_tra |
Chechen | che |
Czech | cs |
Welsh | cy |
Danish | da |
Dargwa | dar |
German | de |
English | en |
Spanish | es |
Estonian | et |
Persian (Farsi) | fa |
French | fr |
Irish | ga |
Goan Konkani | gom |
Hindi | hi |
Croatian | hr |
Hungarian | hu |
Indonesian | id |
Ingush | inh |
Icelandic | is |
Italian | it |
Japanese | ja |
Kabardian | kbd |
Kannada | kn |
Korean | ko |
Kurdish | ku |
Latin | la |
Lak | lbe |
Lezghian | lez |
Lithuanian | lt |
Latvian | lv |
Magahi | mah |
Maithili | mai |
Maori | mi |
Mongolian | mn |
Marathi | mr |
Malay | ms |
Maltese | mt |
Nepali | ne |
Newari | new |
Dutch | nl |
Norwegian | no |
Occitan | oc |
Pali | pi |
Polish | pl |
Portuguese | pt |
Romanian | ro |
Russian | ru |
Serbian (cyrillic) | rs_cyrillic |
Serbian (latin) | rs_latin |
Nagpuri | sck |
Slovak | sk |
Slovenian | sl |
Albanian | sq |
Swedish | sv |
Swahili | sw |
Tamil | ta |
Tabassaran | tab |
Telugu | te |
Thai | th |
Tajik | tjk |
Tagalog | tl |
Turkish | tr |
Uyghur | ug |
Ukranian | uk |
Urdu | ur |
Uzbek | uz |
Vietnamese | vi |
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!