ホームページ  >  記事  >  バックエンド開発  >  PHPでOCR認識機能を実装する方法

PHPでOCR認識機能を実装する方法

WBOY
WBOYオリジナル
2023-05-22 08:15:223147ブラウズ

科学技術の継続的な発展に伴い、光学式文字認識 (OCR) 技術は人工知能の分野において非常に重要な方向性となっています。 1995 年にリリースされた言語の最初のバージョンである PHP は、現在では Web アプリケーション開発にとって最も重要なツールの 1 つとなっています。この記事では、PHPにOCR認識機能を実装する方法を紹介します。

1. OCR の概要

OCR は、さまざまな方法で民意の理解を維持します。これは、紙または電子文書を光学スキャンまたは写真によって編集可能なテキストに変換するテクノロジーです。この技術は非常に精度が高く、OCR技術により多くの紙資料を素早く電子化することができます。 OCR テクノロジーは、文書のアーカイブ、デジタル化された書籍、銀行および保険サービスなど、さまざまな業界で広く使用されています。

2. PHP の実装原理

PHP は広く使用されているサーバーサイド プログラミング言語であり、現在、いくつかの主要な Web サイトやアプリケーションが PHP を使用して構築されています。 PHP は、OCR 機能を Web サイトやアプリケーションに統合できる強力なメカニズムを提供します。 PHP を使用して OCR を実行するには、次の 3 つの手順が必要です:

1. 写真またはスキャンした画像を収集する;
2. 画像を OCR ライブラリに送信する;
3. OCR によって返された結果を解析し、変換してデータベースに保存します。

3. OCR 実装ライブラリ

PHP には OCR ソリューションが組み込まれていません。ただし、PHP で OCR を実行するために利用できる OCR ライブラリが多数あります。より一般的に使用される OCR ライブラリは次のとおりです:

1. Tesseract OCR:

Tesseract OCR は、100 を超える言語をサポートする無料のオープン ソース OCR ライブラリであり、 OCR 分野のパフォーマンスは優れています。

Tesseract OCR のインストールには次の手順が必要です:

a. まずエンジンをインストールします: apt-get install tesseract-ocr。
b. PHP 拡張機能をインストールします: sudo apt-get install php7.2-tesseract。
c. Tessaact OCR をダウンロードして使用します。

2.OCRopus:

OCRopus は、Google によって開発された高度にモジュール化された OCR ソリューションであり、主要な OCR 機能を提供します。 Python で書かれており、拡張可能です。

OCRopus のインストールには次の手順が必要です:

a. Python と関連依存関係をインストールします;
b. OCRopus ライブラリをダウンロードします;
c. OCRopus をインストールして実行します。

3.GOCR:

GOCR も人気のある OCR ライブラリで、Thomas Rokicki によって開発された無料のオープンソース OCR ソフトウェアです。

GOCR のインストールには次の手順が必要です:

a. GOCR エンジンをインストールします;
b. PHP 拡張機能をインストールします;
c. GOCR をダウンロードして使用します。

4. 実装コード例

OCR ライブラリをインストールした後、次のコードを使用して OCR 認識機能を実装できます。

//Tesseract OCR ライブラリを参照します
namespace TesseractOCR;
use thiagoalessioTesseractOCRTesseractOCR;

//解析する画像の場所を設定します
$imageLocation = "images /test. png";

//解析のために画像を Tesseract OCR ライブラリに送信します。
$result = (new TesseractOCR($imageLocation))->run();

// OCR 結果の印刷
echo $result;

5. 注意事項

OCR ライブラリを使用する前に、入力画像の品質が十分に優れていることを確認する必要があります。正しく認識されるようになります。場合によっては、OCR ライブラリにエラーが発生し、状況に応じて手動で修正する必要があります。

6. 概要

この記事では、PHP で OCR ソリューションを実装する方法を紹介しました。 OCR ライブラリを使用して PHP で OCR 操作を実行する方法をデモンストレーションするために、Tesseract OCR、OCRopus、GOCR の 3 つのライブラリが選択されました。これらのライブラリの間には機能的な違いがいくつかあります。自分に合ったものを選択することも、複数のライブラリを選択することもできます。 OCR ライブラリを使用する場合は、正しい結果を得るために入力画像が高品質であることを確認してください。

以上がPHPでOCR認識機能を実装する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。