ホームページ >バックエンド開発 >PHPチュートリアル >PHP を使用して画像認識およびテキスト抽出機能を実装する方法

PHP を使用して画像認識およびテキスト抽出機能を実装する方法

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBオリジナル: 2023-09-05 15:22:442202ブラウズ

如何使用 PHP 实现图像识别和文字提取功能

要約:

現在、画像認識とテキスト抽出は多くの分野で広く使用されています。フィールドセキュリティ監視システムから自動文書処理に至るまで、アプリケーションはこれら 2 つの機能から切り離せません。この記事では、PHPを使用して画像認識やテキスト抽出機能を実装する方法とサンプルコードを紹介します。

はじめに:

画像認識は、コンピューターのアルゴリズムとモデルを使用して画像を識別および分類するテクノロジーです。テキスト抽出とは、画像処理技術を通じて画像から識別可能なテキストを抽出することです。これら 2 つの機能を組み合わせて、画像内のテキストの自動認識と抽出を実現できます。

ステップ:

準備

まず、PHP 環境に、GD ライブラリ、Tesseract OCR ライブラリ、関連する PHP などの関連拡張機能がインストールされていることを確認します。拡張子。 GD ライブラリは画像処理に使用され、Tesseract OCR ライブラリはテキスト認識に使用されます。

画像認識

画像認識を実行するには、まずプログラムに画像を読み込む必要があります。 PHP には、imagecreatefromjpeg、imagecreatefrompng、imagecreatefromgif などのさまざまな形式の画像を読み込むための関数が用意されています。

サンプルコード:

<?php
// 加载 JPEG 图像
$image = imagecreatefromjpeg('image.jpg');

// 进行图像处理和识别操作

// 释放图像资源
imagedestroy($image);
?>

画像をロードした後、GD ライブラリが提供するさまざまな関数を使用して、明るさ、コントラスト、トリミング、回転などの調整など、画像を処理できます。画像が処理された後、画像認識アルゴリズムを呼び出して画像を識別できます。

テキスト抽出

テキスト抽出を実行するには、Tesseract OCR ライブラリを使用する必要があります。 PHP では、tesseract-ocr/tesseract 拡張機能を通じてこれを実現できます。

まず、Tesseract OCR ライブラリが正しくインストールされており、システム環境変数に正しいパスが設定されていることを確認してください。

サンプルコード:

<?php
// 加载图像
$image = imagecreatefromjpeg('image.jpg');

// 将图像保存为临时文件
$tempImagePath = 'temp.jpg';
imagejpeg($image, $tempImagePath);

// 执行文字提取操作
$tesseractPath = 'tesseract';
$command = $tesseractPath . ' ' . $tempImagePath . ' output';

shell_exec($command);

// 读取输出文件中的文字内容
$outputFile = 'output.txt';
$text = file_get_contents($outputFile);
echo $text;

// 删除临时文件
unlink($tempImagePath);
unlink($outputFile);

// 释放图像资源
imagedestroy($image);
?>

サンプルコードでは、まず画像を一時ファイルとして保存し、shell_exec 関数を使用して tesseract コマンドを実行してテキストを抽出します。出力ファイルはテキストへの認識です。最後に、出力ファイル内のテキストコンテンツが読み取られて印刷されます。

結論:

この記事では、PHP を使用して画像認識およびテキスト抽出機能を実装する方法を紹介し、関連するサンプルコードを提供します。画像認識とテキスト抽出により、さまざまなアプリケーションシナリオで自動画像処理とテキスト認識を実装でき、作業効率と精度が向上します。

参考リンク:

PHP GD 拡張ドキュメント: https://www.php.net/manual/zh/book.image.php
Tesseract OCR ：https://github.com/tesseract-ocr/tesseract

以上がPHP を使用して画像認識およびテキスト抽出機能を実装する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明：

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

前の記事：PHP を使用して Web サイトの印刷機能と PDF 生成機能を実装する方法次の記事：PHP を使用して Web サイトの印刷機能と PDF 生成機能を実装する方法

続きを見る

PHP画像認識技術の原理と実装