tess4jを使用してJavaで画像テキスト認識機能を実装するにはどうすればよいですか?-＆＃＆チュートリアル-php.cn

ホームページ

Java

＆＃＆チュートリアル

tess4jを使用してJavaで画像テキスト認識機能を実装するにはどうすればよいですか?

王林

May 09, 2023 pm 05:49 PM

javatess4j

java は画像テキスト認識に tess4j を使用します

1. はじめに

Tess4J は、Tesseract OCR API の Java (JNA) カプセル化です。。
昔、自動ログインを行ってWebページ上の未処理データのボタンをクリックする必要があり、ログイン確認コードの検証が必要だったので、簡単な単語や数字を認識できるTess4Jを使用していました。 , 等、認識率は正常のようですが、エラーが出た場合は認証コードを変更して再試行すれば、あと何回か試しても成功します。ここで、将来の参照のために、以前の簡単な使用プロセスを記録します。

Tess4J は、Tesseract OCR API の Java JNA パッケージです。 Tess4J の API を呼び出して、Java が Tesseract OCR を使用できるようにします。サポートされている形式には、TIFF、JPEG、GIF、PNG、BMP、JPEG、PDF が含まれます。初めてこれに接したとき、私はまだこの 2 つのことの間で混乱していました。明確に言うと、Tess4J は Java で直接使用できる jar パッケージであり、Tesseract OCR は Tess4J をファイルテキスト認識にサポートするための基礎です。 ##Tess4JMaven を使用して直接インポートできます。

2. 使用プロセス

1. Maven の依存関係を pom.xml

		<!-- tess4j start -->
		<dependency>
		    <groupId>net.sourceforge.tess4j</groupId>
		    <artifactId>tess4j</artifactId>
		    <version>5.6.0</version>
		</dependency>
		<!-- tess4j end -->

に導入します

2. 言語ライブラリファイルを tessdata ディレクトリに準備します

関連する言語ライブラリファイルを事前にダウンロードする必要があります。ここでは 2 つの chi_sim.traineddata と eng.traineddata をダウンロードしましたダウンロードアドレス: https://codechina.csdn.net/mirrors/tesseract-ocr /tessdata
ダウンロード後、コード内のディレクトリに配置します

tess4jを使用してJavaで画像テキスト認識機能を実装するにはどうすればよいですか?

3. テスト用のテストコードを記述します

画像を2枚用意して配置しますこれらはコード内にあります。リソースディレクトリでは、プログラムが読み取るのに便利です。

#図 1

tess4jを使用してJavaで画像テキスト認識機能を実装するにはどうすればよいですか?

画像 2

tess4jを使用してJavaで画像テキスト認識機能を実装するにはどうすればよいですか?

#2 つの画像はリソースディレクトリに配置されます

tess4jを使用してJavaで画像テキスト認識機能を実装するにはどうすればよいですか? コードは次のとおりです:

package cn.ljhua;

import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
import java.io.InputStream;

import javax.imageio.ImageIO;

import lombok.extern.slf4j.Slf4j;
import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;

/**
 * Tess4jOcr测试示例
 * @author liujh
 */
@Slf4j
public class Tess4jOcrTest {
	
	public static void main(String[] args) {
		
		Tess4jOcrTest test = new Tess4jOcrTest();
		test.ocrTest();
		
	}
	
	public void ocrTest() {
		
		log.info("ocrTest start....");
		long startMs = System.currentTimeMillis();
		
		 //Tesseract的代码开始---------------------->>>>
		ITesseract instance = new Tesseract();
		
		/**
		 * 组装接好tessdata目录的路径字符串
		 */
		String filePathPre = System.getProperty("user.dir");
    	String dataPath = filePathPre + File.separator + "tessdata";
    	
    	/**
		 * 设置目录datapath the tessdata path to set
		 * 否则会报Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.错误
		 */
    	instance.setDatapath(dataPath);
    	//instance.setLanguage("eng");//默认，可以不写
    	instance.setLanguage("chi_sim");//设置中文识别
		
    	String imageName = "verifyCode.png";
        try (InputStream inStream = this.getClass().getResourceAsStream("/" + imageName)) {
            
        	BufferedImage bImage = ImageIO.read(inStream);
        	//doOCR也可以传参为File，我这里传的BufferedImage
        	String result = instance.doOCR(bImage);
        	//识别的结果回来可能会带回车，处理掉
        	result = result.replaceAll("\n", "");
        	log.info("图片名：" + imageName +" 识别结果："+ result);
        	
        } catch (IOException e) {
            log.error(e.getMessage(),e);
        } catch (TesseractException e) {
        	log.error(e.getMessage(),e);
		}
        
        imageName = "vCode2.jpg";
        try (InputStream inStream = this.getClass().getResourceAsStream("/" + imageName)) {
            
        	BufferedImage bImage = ImageIO.read(inStream);
        	//doOCR也可以传参为File，我这里传的BufferedImage
        	String result = instance.doOCR(bImage);
        	//识别的结果回来可能会带回车，处理掉
        	result = result.replaceAll("\n", "");
        	log.info("图片名：" + imageName +" 识别结果："+ result);
        	
        } catch (IOException e) {
            log.error(e.getMessage(),e);
        } catch (TesseractException e) {
        	log.error(e.getMessage(),e);
		}
		//Tesseract的代码结束--------------------->>>>
        
		log.info("ocrTest success. spend time :{} ms.", (System.currentTimeMillis() - startMs));
		
	}
}

テスト結果のスクリーンショットは次のとおりです:

tess4jを使用してJavaで画像テキスト認識機能を実装するにはどうすればよいですか? 英語の認識は比較的正常であり、中国語の認識にはスペースが含まれていますが、必要に応じて、コードを通じてスペースをさらに削除することができます。この時点で、tess4j の簡単な使用テストは完了です。

以上がtess4jを使用してJavaで画像テキスト認識機能を実装するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は亿速云で複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

Java開発のどの側面がプラットフォームに依存していますか？Apr 26, 2025 am 12:19 AM

javadevelopmentisnotentirelylylypratform-IndopentDuetoseveralfactors.1）jvmvariationsaffectperformanceandbehavioracrossdifferentos.2）nativeLibrariesviajniintroducePlatform-specificissues.3）giaiasystemsdifferbeTioneplateplatifflics.4）

さまざまなプラットフォームでJavaコードを実行するときにパフォーマンスの違いはありますか？なぜ？Apr 26, 2025 am 12:15 AM

Javaコードは、さまざまなプラットフォームで実行するときにパフォーマンスの違いがあります。 1）JVMの実装と最適化戦略は、OracleJDKやOpenJDKなどとは異なります。 2）メモリ管理やスレッドスケジューリングなどのオペレーティングシステムの特性もパフォーマンスに影響します。 3）適切なJVMを選択し、JVMパラメーターとコード最適化を調整することにより、パフォーマンスを改善できます。

Javaのプラットフォームの独立性の制限は何ですか？Apr 26, 2025 am 12:10 AM

java'splatformindepentedencehaslimitationsincludingporformanceoverhead、versioncompatibulisisues、changleSwithnativeLibraryIntegration、プラットフォーム固有の機能、およびjvminStallation/maintenation。

プラットフォームの独立性とクロスプラットフォーム開発の違いを説明します。Apr 26, 2025 am 12:08 AM

PlatformEndependEncealLowsProgramStorunonAnyPlatformWithOdification、whilecross-platformdevelopmentReadreessomeplatform-specificAdjustments.platformindependence、explifiedByjava、unableSiversAlexecutionButMayCompromperformance

ジャストインタイム（JIT）コンピレーションは、Javaのパフォーマンスとプラットフォームの独立性にどのような影響を与えますか？Apr 26, 2025 am 12:02 AM

jitcompalilationinjavaenhancesperformance whelemaintaining formindepence.1）itdynamicallyTrantesiNTODENATIVEMACHINECODEATRUNTIME、最適化されたコードを最適化すること、

Javaがクロスプラットフォームデスクトップアプリケーションを開発するための人気のある選択肢なのはなぜですか？Apr 25, 2025 am 12:23 AM

javaispopularforsoss-platformdesktopapplicationsduetoits "writeonce、runaynay" philosophy.1）itusesbytecodatiTatrunnanyjvm-adipplatform.2）ライブラリリケンディンガンドジャヴァフククレアティック - ルルクリス

Javaでプラットフォーム固有のコードを作成する必要がある場合がある状況について話し合います。Apr 25, 2025 am 12:22 AM

Javaでプラットフォーム固有のコードを作成する理由には、特定のオペレーティングシステム機能へのアクセス、特定のハードウェアとの対話、パフォーマンスの最適化が含まれます。 1）JNAまたはJNIを使用して、Windowsレジストリにアクセスします。 2）JNIを介してLinux固有のハードウェアドライバーと対話します。 3）金属を使用して、JNIを介してMacOSのゲームパフォーマンスを最適化します。それにもかかわらず、プラットフォーム固有のコードを書くことは、コードの移植性に影響を与え、複雑さを高め、パフォーマンスのオーバーヘッドとセキュリティのリスクをもたらす可能性があります。

Javaは、クラウドネイティブアプリケーション、マルチプラットフォームの展開、および言語間の相互運用性を通じて、プラットフォームの独立性をさらに強化します。 1）クラウドネイティブアプリケーションは、GraalvmとQuarkusを使用してスタートアップ速度を向上させます。 2）Javaは、埋め込みデバイス、モバイルデバイス、量子コンピューターに拡張されます。 3）Graalvmを通じて、JavaはPythonやJavaScriptなどの言語とシームレスに統合して、言語間の相互運用性を高めます。

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。