ホームページ >バックエンド開発 >PHPチュートリアル >PHP を使用して画像認識およびテキスト抽出機能を実装する方法

PHP を使用して画像認識およびテキスト抽出機能を実装する方法

WBOY
WBOYオリジナル
2023-09-05 15:22:441946ブラウズ

如何使用 PHP 实现图像识别和文字提取功能

PHP を使用して画像認識およびテキスト抽出機能を実装する方法

要約:

現在、画像認識とテキスト抽出は多くの分野で広く使用されています。フィールド セキュリティ監視システムから自動文書処理に至るまで、アプリケーションはこれら 2 つの機能から切り離せません。この記事では、PHPを使用して画像認識やテキスト抽出機能を実装する方法とサンプルコードを紹介します。

はじめに:

画像認識は、コンピューターのアルゴリズムとモデルを使用して画像を識別および分類するテクノロジーです。テキスト抽出とは、画像処理技術を通じて画像から識別可能なテキストを抽出することです。これら 2 つの機能を組み合わせて、画像内のテキストの自動認識と抽出を実現できます。

ステップ:

  1. 準備

まず、PHP 環境に、GD ライブラリ、Tesseract OCR ライブラリ、関連する PHP などの関連拡張機能がインストールされていることを確認します。拡張子。 GD ライブラリは画像処理に使用され、Tesseract OCR ライブラリはテキスト認識に使用されます。

  1. 画像認識

画像認識を実行するには、まずプログラムに画像を読み込む必要があります。 PHP には、imagecreatefromjpeg、imagecreatefrompng、imagecreatefromgif などのさまざまな形式の画像を読み込むための関数が用意されています。

サンプルコード:

<?php
// 加载 JPEG 图像
$image = imagecreatefromjpeg('image.jpg');

// 进行图像处理和识别操作

// 释放图像资源
imagedestroy($image);
?>

画像をロードした後、GD ライブラリが提供するさまざまな関数を使用して、明るさ、コントラスト、トリミング、回転などの調整など、画像を処理できます。画像が処理された後、画像認識アルゴリズムを呼び出して画像を識別できます。

  1. テキスト抽出

テキスト抽出を実行するには、Tesseract OCR ライブラリを使用する必要があります。 PHP では、tesseract-ocr/tesseract 拡張機能を通じてこれを実現できます。

まず、Tesseract OCR ライブラリが正しくインストールされており、システム環境変数に正しいパスが設定されていることを確認してください。

サンプルコード:

<?php
// 加载图像
$image = imagecreatefromjpeg('image.jpg');

// 将图像保存为临时文件
$tempImagePath = 'temp.jpg';
imagejpeg($image, $tempImagePath);

// 执行文字提取操作
$tesseractPath = 'tesseract';
$command = $tesseractPath . ' ' . $tempImagePath . ' output';

shell_exec($command);

// 读取输出文件中的文字内容
$outputFile = 'output.txt';
$text = file_get_contents($outputFile);
echo $text;

// 删除临时文件
unlink($tempImagePath);
unlink($outputFile);

// 释放图像资源
imagedestroy($image);
?>

サンプルコードでは、まず画像を一時ファイルとして保存し、shell_exec 関数を使用して tesseract コマンドを実行してテキストを抽出します。出力ファイルはテキストへの認識です。最後に、出力ファイル内のテキスト コンテンツが読み取られて印刷されます。

結論:

この記事では、PHP を使用して画像認識およびテキスト抽出機能を実装する方法を紹介し、関連するサンプル コードを提供します。画像認識とテキスト抽出により、さまざまなアプリケーション シナリオで自動画像処理とテキスト認識を実装でき、作業効率と精度が向上します。

参考リンク:

  1. PHP GD 拡張ドキュメント: https://www.php.net/manual/zh/book.image.php
  2. Tesseract OCR :https://github.com/tesseract-ocr/tesseract

以上がPHP を使用して画像認識およびテキスト抽出機能を実装する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

関連記事

続きを見る