ホームページ >バックエンド開発 >Python チュートリアル >Pytesseract を 1 桁の数値認識のみに設定するにはどうすればよいですか?
Pytesseract OCR: 1 桁および数字のみの認識用の構成
オープンソース OCR ライブラリである Pytesseract は、構成における柔軟性を提供します。特定の要件に対応するエンジン。このコンテキストでは、数字 '0' が文字 'O' と誤って解釈されることが多いため、数字に制限しながら 1 桁の数字を認識するように Tesseract を構成することを目指しています。
問題定義
次のコマンドを使用してこの目的のために Pytesseract を構成すると、ユーザーは問題に遭遇します構文:
target = pytesseract.image_to_string(im,config='-psm 7',config='outputbase digits')
構成パラメータ
tesseract-4.0.0a で概要が説明されているように、Tesseract は、それぞれ固有の特性を持つさまざまなページ セグメンテーション モードをサポートしています。単一文字の認識を有効にするには、psm を 10 に設定します。さらに、認識を数字に制限するために、必要な範囲の数字 (0 ~ 9) のみを含むように tessedit_char_whitelist を設定します。
target = pytesseract.image_to_string(image, lang='eng', boxes=False, \ config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')
以上がPytesseract を 1 桁の数値認識のみに設定するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。