ホームページ >バックエンド開発 >Python チュートリアル >正確な数字認識のために Tesseract OCR を微調整するにはどうすればよいですか?

正確な数字認識のために Tesseract OCR を微調整するにはどうすればよいですか?

Linda Hamilton
Linda Hamiltonオリジナル
2024-11-26 02:02:09394ブラウズ

How Can I Fine-Tune Tesseract OCR for Accurate Digit Recognition?

OCR 精度を微調整するための Tesseract 構成

広く採用されている OCR ライブラリである Pytesseract は、文字認識を最適化するための堅牢な構成オプションを提供します。数字と文字の区別などの特定の課題に対処するために、この調査では Tesseract を効果的に構成するためのガイダンスを求めています。

数字中心の認識のためのマルチ構成セットアップ

元のセットアップでは、ページ分割のための -psm 7 と、出力を数字に制限するための outbase 数字の両方。ただし、最適な結果を得るには:

  • 文字認識: 単一文字認識を有効にするには、psm を 10 に設定します。これにより、各文字が独立して処理されることが保証されます。
  • 数字の制限: 認識を数字のみに制限するには、tessedit_char_whitelist=0123456789 を使用します。前述したように、ゼロ (「0」) は文字「O」と混同されることがよくあります。

設定の使用例

次に、その方法を示します。 image_to_string を使用してこれらの構成を実装します:

target = pytesseract.image_to_string(image, lang='eng', boxes=False, \
        config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')

この構成では、--psm 10 を利用します。文字認識、Tesseract エンジン選択用の --oem 3、および桁制限を強制するための -c tessedit_char_whitelist=0123456789。複数の構成を同時に指定することで、特定の要件を満たすように Tesseract の動作を微調整できます。

以上が正確な数字認識のために Tesseract OCR を微調整するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。