>백엔드 개발 >파이썬 튜토리얼 >한 자리 숫자만 인식하도록 Pytesseract를 구성하는 방법은 무엇입니까?

한 자리 숫자만 인식하도록 Pytesseract를 구성하는 방법은 무엇입니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-12-27 12:30:10138검색

How to Configure Pytesseract for Single-Digit Number Recognition Only?

Pytesseract OCR: 단일 숫자 및 숫자만 인식하도록 구성

오픈 소스 OCR 라이브러리인 Pytesseract는 구성에 유연성을 제공합니다. 특정 요구 사항에 맞는 엔진. 이러한 맥락에서 우리는 숫자 '0'이 문자 'O'로 잘못 해석될 수 있기 때문에 Tesseract가 한 자리 숫자만 인식하고 숫자로 제한하도록 구성하는 것을 목표로 합니다.

문제 정의

다음을 사용하여 이 목적으로 Pytesseract를 구성할 때 사용자가 어려움을 겪습니다. 구문:

target = pytesseract.image_to_string(im,config='-psm 7',config='outputbase digits')

구성 매개변수

tesseract-4.0.0a에 설명된 대로 Tesseract는 각각 특정 특성을 가진 다양한 페이지 분할 모드를 지원합니다. 단일 문자 인식을 활성화하려면 psm을 10으로 설정합니다. 또한 인식을 숫자로 제한하기 위해 원하는 숫자 범위(0-9)만 포함하도록 tessedit_char_whitelist를 설정합니다.

target = pytesseract.image_to_string(image, lang='eng', boxes=False, \
        config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')

위 내용은 한 자리 숫자만 인식하도록 Pytesseract를 구성하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.