ホームページ  >  記事  >  バックエンド開発  >  Windows で tesseract-ocr 4.00 をインストールして構成するにはどうすればよいですか?

Windows で tesseract-ocr 4.00 をインストールして構成するにはどうすればよいですか?

零下一度
零下一度オリジナル
2017-06-23 14:09:144877ブラウズ

最近はテキスト認識をする必要があり、他の人のインターフェースを直接使用することはできないので、オープンソースライブラリを使用することしかできません。 tesseract-ocr は、HP のオープンソース テキスト認識プロジェクトであり、画像およびテキスト認識システムを迅速に構築でき、画像を認識できる OCR システムの開発に役立ちます。 Windows環境で開発を行っているため、システムをWindows環境にインストールする必要があります。

ステップ 1: インストール パッケージをダウンロードします

これによると、非公式のインストール パッケージは、64 ビットのインストール パッケージ http://digi.bib.uni-mannheim.de/tesseract/ しか見られなかったようです。 tesseract-ocr -setup-4.00.00dev.exe をダウンロードした後、直接インストールできますが、後で環境変数を設定するので、インストール ディレクトリを覚えておいてください。

英語の画像とテキストの認識を行っていない場合は、他の言語の認識パッケージもダウンロードする必要があります。

簡体字中国語文字認識パッケージ:

繁体字中国語文字認識パッケージ:

ステップ 2: インストール

ダウンロードした tesseract-ocr-setup-4.00.00dev.exe を直接実行し、次のステップ、次のステップでインストールします。

ステップ 3: 環境変数を構成する

注: 私のシステムは win7 ですが、Java 変数の構成と同様に、他のシステムも同様であるはずです

インストール アドレスをコピーします。私のものは C:Program Files (x86)Tesseract -OCR にインストールされています。インターフェースは次のとおりです:

インストールパス「C:Program Files (x86)Tesseract-OCR」をコピーし、「コントロールパネル システムとセキュリティシステム」と入力し、

「システム保護」をクリックします

次のインターフェイスに移動します:

環境変数をクリックして、以下の構成インターフェイスに入ります:

今インストールしたパス「C:Program Files (x86)Tesseract-OCR」をPATH と赤の下線の付いたパスは、先頭を「;」で区切って、末尾を「;」で区切ってください。以下は私の構成情報のサンプルです:

C:UsersAdministratorAppDataRoamingComposervendorbin;C:UsersAdministratorAppDataRoamingnpm;C:Program Files (x86)Tesseract-OCR;

構成後、[保存]をクリックします。

コマンドターミナルを開き、tesseract -vと入力すると、バージョン情報が表示されます

エラーが発生した場合は、環境変数が正しく設定されていない可能性があります。

この時点では、インストールが完了していても、システムはまだ中国語を認識できません。簡体字中国語と繁体字中国語の言語パックをダウンロードする必要があります (ダウンロード後、インストール ディレクトリに配置します)。 tessconfigs ディレクトリに移動するだけです。

補足: グローバル変数が設定されていないため、ディスク間でデータ変換を実行することはできません。ここでは、環境変数に設定情報を追加します

システム変数 --> 新規:

TESSDATA_PREFIX 変数名を追加します。変数値またはインストール パス C:Program Files (x86)Tesseract-OCR;

以上がWindows で tesseract-ocr 4.00 をインストールして構成するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。