Pytesseract OCR: 단일 숫자 및 숫자만 인식하도록 구성
오픈 소스 OCR 라이브러리인 Pytesseract는 구성에 유연성을 제공합니다. 특정 요구 사항에 맞는 엔진. 이러한 맥락에서 우리는 숫자 '0'이 문자 'O'로 잘못 해석될 수 있기 때문에 Tesseract가 한 자리 숫자만 인식하고 숫자로 제한하도록 구성하는 것을 목표로 합니다.
문제 정의
다음을 사용하여 이 목적으로 Pytesseract를 구성할 때 사용자가 어려움을 겪습니다. 구문:
target = pytesseract.image_to_string(im,config='-psm 7',config='outputbase digits')
구성 매개변수
tesseract-4.0.0a에 설명된 대로 Tesseract는 각각 특정 특성을 가진 다양한 페이지 분할 모드를 지원합니다. 단일 문자 인식을 활성화하려면 psm을 10으로 설정합니다. 또한 인식을 숫자로 제한하기 위해 원하는 숫자 범위(0-9)만 포함하도록 tessedit_char_whitelist를 설정합니다.
target = pytesseract.image_to_string(image, lang='eng', boxes=False, \ config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')
위 내용은 한 자리 숫자만 인식하도록 Pytesseract를 구성하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!