Maison >développement back-end >Tutoriel Python >Comment puis-je configurer Pytesseract pour la reconnaissance d'un seul chiffre avec une sortie numérique uniquement ?

Comment puis-je configurer Pytesseract pour la reconnaissance d'un seul chiffre avec une sortie numérique uniquement ?

Barbara Streisand
Barbara Streisandoriginal
2024-12-03 13:34:10231parcourir

How Can I Configure Pytesseract for Single Digit Recognition with Number-Only Output?

OCR Pytesseract avec reconnaissance d'un seul chiffre et contraintes numériques uniquement

Dans le contexte de Pytesseract, configuration de Tesseract pour reconnaître les chiffres uniques et restreindre la sortie les chiffres peuvent être difficiles. Pour résoudre ce problème, nous approfondissons les spécificités des options de configuration de Tesseract.

Modes de segmentation de page Tesseract

Tesseract propose différents modes de segmentation de page (psm) pour gérer divers textes. mises en page. Pour la reconnaissance d'un seul caractère, le psm approprié est 10. Ce mode traite l'image comme un seul caractère.

Liste blanche des caractères

Pour limiter les caractères reconnus aux nombres, nous peut exploiter le paramètre de configuration tessedit_char_whitelist. En spécifiant 0123456789 comme liste blanche, Tesseract n'acceptera que ces caractères.

Exemple d'utilisation

Voici un exemple d'utilisation de image_to_string avec plusieurs options de configuration :

target = pytesseract.image_to_string(image, lang='eng', boxes=False, 
        config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')

En définissant psm sur 10 et en utilisant la liste blanche des caractères, cette configuration garantit que Tesseract reconnaîtra les chiffres uniques tout en limitant la sortie aux valeurs numériques. De plus, lang spécifie la langue, boxes désactive les limites des zones de texte et oem sélectionne le moteur OCR.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn