Maison > Article > développement back-end > Comment reconnaître le texte dans les images en python
Comment Python reconnaît le texte dans les images, voici un cas avec les étapes détaillées :
Installation du package de module :
1. Installez PIL : pip install Pillow
2. Installez pytesser3 : pip install pytesser3
3. Installez pytesseract : pip install pytesseract
4. Installez autopy3 :
.Installez d'abord wheel : pip install wheel
Téléchargez autopy3-0.51.1-cp36-cp36m-win_amd64.whl [Cliquez pour ouvrir le lien]
Exécutez la commande : pip install E :360 secure browser download autopy3-0.51.1-cp36-cp36m-win_amd64.whl
5. Installez Tesseract-OCR : Baidu recherche directement Tesseract-OCR pour télécharger
Voici les instructions. Le problème est qu'après avoir installé Tesseract-OCR, il ne sera pas ajouté par défaut au chemin de la variable d'environnement
Il existe deux solutions : (recherchez d'abord le dossier d'installation de Tesseract-OCR, puis recherchez le tesseract.exe fichier)
Mon chemin absolu ici est : D:pythonTesseract-OCRtesseract.exe
①Ajoutez ce chemin au chemin de la variable d'environnement (mais je l'ai fait, mais PyCharm a quand même signalé une erreur )
②Trouvez le fichier pytesseract.py
Mon voici C:UsersadminAppDataLocalProgramsPythonPython36Libsite-packagespytesseractpytesseract.py
Modifiez le tesseract_cmd dans le fichier avec le chemin absolu ci-dessus
Allons droit au but, comment reconnaître les caractères chinois dans les images
Photo originale ci-dessus : (Il s'agit d'une réplique classique du Pianiste sur la mer)
Ensuite, nous devons utiliser le pytesseract de python pour identifier les personnages dans l'image
# _*_ coding:utf-8 _*_ import pytesseract from PIL import Image __author__ = 'admin' im = Image.open(r'C:\Users\admin\Desktop\example.png') print(pytesseract.image_to_string(im))
Rendu
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!