Heim >Backend-Entwicklung >Python-Tutorial >Python-Bildtexterkennung
Ich habe in letzter Zeit gedacht, dass es kein Tool zur Bildtexterkennung gibt? Ich dachte an OCR, die relativ leistungsstarke Hanwang-OCR in China. Kann dies also mit Hilfe von Python erreicht werden? Also suchte und suchte ich nach Informationen über die Python-Diskussion in diesem Bereich und fand ein so unterhaltsames Programm wie PyTesser! Nehmen Sie es heraus und teilen Sie es zur Diskussion:
PyTesser ist ein optisches Zeichenerkennungsmodul für Python. Es wird in Verbindung mit der Tesseract OCR-Engine verwendet, um eine Zeichenfolge aus einem Bild oder einer Bilddatei zu extrahieren und auszugeben.
Um PyTesser zu verwenden, müssen Sie nicht die Tesseract OCR-Engine installieren, sondern müssen zuerst das PIL-Modul (Python Image Library, Python-Grafikbibliothek) installieren
Offizielle Einführung:
PyTesser ist ein optisches Zeichenerkennungsmodul für Python. Es nimmt als Eingabe ein Bild oder eine Bilddatei und gibt eine Zeichenfolge aus.
PyTesser verwendet die Tesseract OCR-Engine, konvertiert Bilder in ein akzeptiertes Format und ruft Tesseract auf Als externes Skript ausführbar. Die Skripte sollten auch in anderen Betriebssystemen funktionieren.
Offizielle Download-Adresse von PyTesser: http://code.google.com/p /pytesser/ downloads/list
Ressourcenadresse der PIL-Bibliothek: http://www.pythonware.com/products/pil/
Während der Testverwendung wurde jedoch festgestellt, dass dies der Fall ist Idealer ist es, nur englische Inhalte zu erkennen, aber Chinesisch nicht verarbeiten und erkennen zu können!
Interessierte Studierende können es ausprobieren