ホームページ >バックエンド開発 >Python チュートリアル >Pytesseract を 1 桁の数値認識のみに設定するにはどうすればよいですか?

Pytesseract を 1 桁の数値認識のみに設定するにはどうすればよいですか?

Mary-Kate Olsen
Mary-Kate Olsenオリジナル
2024-12-27 12:30:10131ブラウズ

How to Configure Pytesseract for Single-Digit Number Recognition Only?

Pytesseract OCR: 1 桁および数字のみの認識用の構成

オープンソース OCR ライブラリである Pytesseract は、構成における柔軟性を提供します。特定の要件に対応するエンジン。このコンテキストでは、数字 '0' が文字 'O' と誤って解釈されることが多いため、数字に制限しながら 1 桁の数字を認識するように Tesseract を構成することを目指しています。

問題定義

次のコマンドを使用してこの目的のために Pytesseract を構成すると、ユーザーは問題に遭遇します構文:

target = pytesseract.image_to_string(im,config='-psm 7',config='outputbase digits')

構成パラメータ

tesseract-4.0.0a で概要が説明されているように、Tesseract は、それぞれ固有の特性を持つさまざまなページ セグメンテーション モードをサポートしています。単一文字の認識を有効にするには、psm を 10 に設定します。さらに、認識を数字に制限するために、必要な範囲の数字 (0 ~ 9) のみを含むように tessedit_char_whitelist を設定します。

target = pytesseract.image_to_string(image, lang='eng', boxes=False, \
        config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')

以上がPytesseract を 1 桁の数値認識のみに設定するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。