Heim >Backend-Entwicklung >Python-Tutorial >Wie kann ich Pytesseract für die Erkennung einzelner Ziffern mit reiner Zahlenausgabe konfigurieren?

Wie kann ich Pytesseract für die Erkennung einzelner Ziffern mit reiner Zahlenausgabe konfigurieren?

Barbara Streisand
Barbara StreisandOriginal
2024-12-03 13:34:10299Durchsuche

How Can I Configure Pytesseract for Single Digit Recognition with Number-Only Output?

Pytesseract OCR mit Erkennung einzelner Ziffern und Einschränkungen nur auf Zahlen

Im Kontext von Pytesseract die Konfiguration von Tesseract, um einzelne Ziffern zu erkennen und die Ausgabe einzuschränken Zahlen zu verstehen, kann eine Herausforderung sein. Um dieses Problem anzugehen, befassen wir uns mit den Besonderheiten der Konfigurationsoptionen von Tesseract.

Tesseract-Seitensegmentierungsmodi

Tesseract bietet verschiedene Seitensegmentierungsmodi (PSM) zur Verarbeitung verschiedener Texte Layouts. Für die Erkennung einzelner Zeichen beträgt der geeignete PSM-Wert 10. Dieser Modus behandelt das Bild als einzelnes Zeichen.

Whitelist für Zeichen

Um die erkannten Zeichen auf Zahlen zu beschränken, haben wir kann den Konfigurationsparameter tessedit_char_whitelist nutzen. Durch die Angabe von 0123456789 als Whitelist akzeptiert Tesseract nur diese Zeichen.

Beispielverwendung

Hier ist ein Beispiel für die Verwendung von image_to_string mit mehreren Konfigurationsoptionen:

target = pytesseract.image_to_string(image, lang='eng', boxes=False, 
        config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')

Indem Sie psm auf 10 setzen und die Zeichen-Whitelist verwenden, wird dies erreicht Die Konfiguration stellt sicher, dass Tesseract einzelne Ziffern erkennt, während die Ausgabe auf numerische Werte beschränkt wird. Darüber hinaus gibt „lang“ die Sprache an, „boxes“ deaktiviert die Grenzen von Textfeldern und „oem“ wählt die OCR-Engine aus.

Das obige ist der detaillierte Inhalt vonWie kann ich Pytesseract für die Erkennung einzelner Ziffern mit reiner Zahlenausgabe konfigurieren?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn