PHPとTesseractを使ってOCR画像テキスト認識機能を実装する-PHPチュートリアル-php.cn

ホームページ

バックエンド開発

PHPチュートリアル

PHPとTesseractを使ってOCR画像テキスト認識機能を実装する

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 25, 2023 am 10:01 AM

phpocrtesseract

人工知能とコンピュータービジョンテクノロジーの急速な発展に伴い、光学式文字認識システムである OCR (光学式文字認識) はますます成熟しており、多くのアプリケーションシナリオで必要な機能となっています。 OCR システムは画像内のテキストを認識できるため、画像内の情報をデジタル処理してインテリジェントに分析できます。この記事では、PHPとTesseractを使ってOCR画像テキスト認識機能を実装する方法を紹介します。

1. Tesseract の概要

Tesseract は、HP Labs によって開発され、オープンソースコミュニティに貢献したオープンソース OCR エンジンです。多言語に対応しており、認識性と精度が高いです。 Tesseract の最新バージョンは 4.1.1 です。

2. 環境を構成して Tesseract をインストールする

PHP をインストールする

まず、PHP をローカルまたはサーバーにインストールする必要があります。 XAMPP または WAMP 環境がこのマシンに既にインストールされている場合は、xampp または wamp に付属の PHP を直接使用できますが、そうでない場合は手動でインストールする必要があります。

Tesseract のインストール

公式 Web サイト https://github.com/tesseract-ocr/tesseract から Tesseract をダウンロードし、使用するオペレーティングシステムに応じてダウンロードを選択します。使っている。ダウンロードが完了したらインストールします。中国語を使用する必要がある場合は、対応する言語パックもダウンロードする必要があります。

コマンドラインウィンドウで tesseract --version を実行して、Tesseract が正常にインストールされているかどうかを確認します。

3. PHP と Tesseract を使用して OCR 画像テキスト認識機能を実装します

PHP と Tesseract をインストールしてインストールします

まず、以下をインストールする必要がありますPHPを起動し、Tesseractをインストールします。

2. 画像パスを渡してコマンド認識を実行します

exec 関数 (またはshell_exec() または system()) を使用してコマンドを実行し、画像内のテキストを認識します。渡されるパラメータは Tesseract に必要なコマンドパラメータです。「chi_sim」は認識される言語であり、必要に応じて変更できます。

$command = "tesseract ". $image_path ." " .$output_path." -l chi_sim";
//コマンドを実行
exec($command);

認識結果の取得

file_get_contents() 関数を使用して、最終的な認識結果を取得して返します。

if (file_exists($output_path.'.txt')) {

    $content = file_get_contents($output_path.'.txt');
    //返回识别结果
    return $content;

}

4. Test

次は簡単な例です。 OCR画像テキスト認識機能が正しく動作するかテストします。

(1) まず、画像を準備する必要があります。ここでは中国語のテキストを含む画像を使用します。

(2) 認識する画像のパスと出力結果のパスを関数に渡すコードは次のとおりです:

function ocr($image_path, $output_path) {

$command = "tesseract ". $image_path ." " .$output_path." -l chi_sim"; 
//执行命令
exec($command);

if (file_exists($output_path.'.txt')) {
    $content = file_get_contents($output_path.'.txt');
    //返回识别结果
    return $content;
}

}

(3) 関数を呼び出して結果を出力するコードは次のとおりです:

$image_path = './test.jpg';
$output_path = './test';
$result = ocr($image_path,$output_path);

echo $result;

(4) プログラムを実行します。すべてが正常であれば、次の結果が出力されます:

「これは中国語のテキストを含むテスト画像です。」

5. 概要

この記事の導入部を通じて、読者はその方法を学ぶことができます。 PHP と Tesseract を使用して OCR 画像テキスト認識機能を実装します。画像テキスト認識を必要とする一部のアプリケーションシナリオでは、高速かつ正確なテキスト抽出が実現され、作業効率と精度が向上します。もちろん、さまざまなアプリケーションシナリオで、本当により良い結果を達成するには、実際のニーズに応じてコードを変更および最適化する必要があります。

以上がPHPとTesseractを使ってOCR画像テキスト認識機能を実装するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

PHPの継続的な使用：その持久力の理由Apr 19, 2025 am 12:23 AM

まだ人気があるのは、使いやすさ、柔軟性、強力なエコシステムです。 1）使いやすさとシンプルな構文により、初心者にとって最初の選択肢になります。 2）Web開発、HTTP要求とデータベースとの優れた相互作用と密接に統合されています。 3）巨大なエコシステムは、豊富なツールとライブラリを提供します。 4）アクティブなコミュニティとオープンソースの性質は、それらを新しいニーズとテクノロジーの傾向に適応させます。

PHPおよびPython：類似点と相違点を調査しますApr 19, 2025 am 12:21 AM

PHPとPythonはどちらも、Web開発、データ処理、自動化タスクで広く使用されている高レベルのプログラミング言語です。 1.PHPは、ダイナミックウェブサイトとコンテンツ管理システムの構築によく使用されますが、PythonはWebフレームワークとデータサイエンスの構築に使用されることがよくあります。 2.PHPはエコーを使用してコンテンツを出力し、Pythonは印刷を使用します。 3.両方ともオブジェクト指向プログラミングをサポートしますが、構文とキーワードは異なります。 4。PHPは弱いタイプの変換をサポートしますが、Pythonはより厳しくなります。 5. PHPパフォーマンスの最適化には、Opcacheおよび非同期プログラミングの使用が含まれますが、PythonはCprofileおよび非同期プログラミングを使用します。

PHPおよびPython：さまざまなパラダイムが説明されていますApr 18, 2025 am 12:26 AM

PHPは主に手順プログラミングですが、オブジェクト指向プログラミング（OOP）もサポートしています。 Pythonは、OOP、機能、手続き上のプログラミングなど、さまざまなパラダイムをサポートしています。 PHPはWeb開発に適しており、Pythonはデータ分析や機械学習などのさまざまなアプリケーションに適しています。

PHPとPython：彼らの歴史を深く掘り下げますApr 18, 2025 am 12:25 AM

PHPは1994年に発信され、Rasmuslerdorfによって開発されました。もともとはウェブサイトの訪問者を追跡するために使用され、サーバー側のスクリプト言語に徐々に進化し、Web開発で広く使用されていました。 Pythonは、1980年代後半にGuidovan Rossumによって開発され、1991年に最初にリリースされました。コードの読みやすさとシンプルさを強調し、科学的コンピューティング、データ分析、その他の分野に適しています。

PHPとPythonの選択：ガイドApr 18, 2025 am 12:24 AM

PHPはWeb開発と迅速なプロトタイピングに適しており、Pythonはデータサイエンスと機械学習に適しています。 1.PHPは、単純な構文と迅速な開発に適した動的なWeb開発に使用されます。 2。Pythonには簡潔な構文があり、複数のフィールドに適しており、強力なライブラリエコシステムがあります。

PHPとフレームワーク：言語の近代化Apr 18, 2025 am 12:14 AM

PHPは、多数のWebサイトとアプリケーションをサポートし、フレームワークを通じて開発ニーズに適応するため、近代化プロセスで依然として重要です。 1.PHP7はパフォーマンスを向上させ、新機能を紹介します。 2。Laravel、Symfony、Codeigniterなどの最新のフレームワークは、開発を簡素化し、コードの品質を向上させます。 3.パフォーマンスの最適化とベストプラクティスは、アプリケーションの効率をさらに改善します。

PHPの影響：Web開発などApr 18, 2025 am 12:10 AM

phphassiblasifly-impactedwebdevevermentandsbeyondit.1）itpowersmajorplatformslikewordpratsandexcelsindatabase interactions.2）php'sadaptableability allowsitale forlargeapplicationsusingframeworkslikelavel.3）

スカラータイプ、リターンタイプ、ユニオンタイプ、ヌル可能なタイプなど、PHPタイプのヒントはどのように機能しますか？Apr 17, 2025 am 12:25 AM

PHPタイプは、コードの品質と読みやすさを向上させるためのプロンプトがあります。 1）スカラータイプのヒント：php7.0であるため、基本データ型は、int、floatなどの関数パラメーターで指定できます。 3）ユニオンタイプのプロンプト：PHP8.0であるため、関数パラメーターまたは戻り値で複数のタイプを指定することができます。 4）Nullable Typeプロンプト：null値を含めることができ、null値を返す可能性のある機能を処理できます。

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SublimeText3 中国語版

中国語版、とても使いやすい

Dreamweaver Mac版

ビジュアル Web 開発ツール

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。