Heim  >  Artikel  >  Backend-Entwicklung  >  Python-Code realisiert die Bildtexterkennung

Python-Code realisiert die Bildtexterkennung

零到壹度
零到壹度Original
2018-04-02 14:12:092689Durchsuche

Dieser Artikel teilt Ihnen den Python-Code zur Implementierung der Bildtexterkennung mit. Ich hoffe, er kann Freunden in Not helfen BeispielDas Folgende ist das Bild, das wir identifizieren möchten


Werfen wir zunächst einen Blick auf die RenderingsPython-Code realisiert die Bildtexterkennung

Die Ergebnisse Nachdem wir den Code ausgeführt haben, erhalten wir Folgendes: Einige Wörter wurden nicht richtig erkannt, die meisten Wörter wurden jedoch erkannt.

Python-Code realisiert die Bildtexterkennung
Eine Codezeile kann Bilder identifizieren, wir müssen hinter den Kulissen einige Vorbereitungsarbeiten durchführen

风急天高猿啸哀 渚芸胄芳少白鸟飞凤
无边落木萧萧下, 不尽长量工盲衮宕衮来
万里悲秋常1乍窨, 百年多病独登氤
艰难苦恨擎霜量 漂倒新停澍酉帆

Hier müssen wir zwei Bibliotheken verwenden: Pytesseract und PIL
  • Gleichzeitig müssen wir auch die Erkennungs-Engine tesseract-ocr installieren
  • Lassen Sie uns über die Installation dieser Bibliotheken sprechen, denn es gibt nur diese Bibliotheken Nach der Installation kann Python die Bildtexterkennung mit einer Codezeile realisieren
1. Installation von Pytesseract und PIL

Sie können diese beiden Pakete mit Hilfe von pip - 1. Befehlszeileninstallation

pip install PIL

pip install pytesseract

- 2. Wenn Sie den Pycharm-Editor verwenden, können Sie Pycharm direkt verwenden, um eine schnelle Installation zu erreichen.
Befolgen Sie die folgenden Schritte auf der Einstellungsseite von pycharm


Auf diese Weise können Sie Pytesseract erfolgreich installieren. Um PIL zu installieren, müssen Sie im dritten Schritt oben nur nach PIL suchen und klicken Installieren

Python-Code realisiert die Bildtexterkennung
Zu diesem Zeitpunkt haben wir die Bibliothek installiert und den folgenden Code ausgeführt
Python-Code realisiert die Bildtexterkennung

Der folgende Fehler wird gemeldet. Der Grund für den Fehler ist: Die Erkennungs-Engine tesseract-ocr

from PIL import Image
import pytesseract
text=pytesseract.image_to_string(Image.open('denggao.jpeg'),lang='chi_sim')
print(text)

Zweitens installieren Sie die Erkennungs-Engine tesseract-ocr

Python-Code realisiert die Bildtexterkennung

1. Laden Sie die Installation herunter Paket unten, und klicken Sie dann, um es direkt zu installieren

tesseract-ocr Installationspaket und chinesisches Sprachpaket

  • Entpacken und installieren Sie tesseract-ocr und führen Sie die folgenden Schritte aus, um die chinesische Erkennung zu unterstützen. Weil tesseract-ocr die chinesische Erkennung standardmäßig nicht unterstützt.


2. Nach der Installation von tesseract-ocr müssen wir noch einige Konfigurationen vornehmen Python-Code realisiert die Bildtexterkennung Suchen Sie pytesseract.py in C:UsershuxiuAppDataLocalProgramsPythonPython35Libsite-packagespytesseract und öffnen Sie es Führen Sie den folgenden Vorgang aus:


  • kann auch zum schnellen Öffnen von pytesseract.py über pycharm verwendet werden

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
#tesseract_cmd = 'tesseract'
tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

Python-Code realisiert die Bildtexterkennung

Python-Code realisiert die BildtexterkennungJetzt sind alle unsere Konfigurationen abgeschlossen. Führen Sie den folgenden Code aus, um das Bildgedicht Du Fu's Ascension in Text zu analysieren

Python-Code realisiert die Bildtexterkennung

Das obige ist der detaillierte Inhalt vonPython-Code realisiert die Bildtexterkennung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn