ホームページ  >  記事  >  バックエンド開発  >  PHP を OCR 認識とテキスト認識に使用するにはどうすればよいですか?

PHP を OCR 認識とテキスト認識に使用するにはどうすればよいですか?

王林
王林オリジナル
2023-05-21 08:18:402090ブラウズ

デジタル時代の継続的な発展に伴い、保管と検索を容易にするために、大量の紙文書をデジタル化する必要があります。データを効果的に変換するために、多くの企業や個人は、スキャンした紙文書のテキストをデジタル形式に変換できる OCR テクノロジー (光学式文字認識、光学式文字認識) を選択しています。

PHP は、一般的に使用されるプログラミング言語として、OCR 認識やテキスト認識にも使用できます。この記事では、PHPを使用してOCR認識とテキスト認識を行う方法を紹介します。

1. PHP OCR 認識

PHP で OCR 認識を実行するには、いくつかの OCR 認識ライブラリを使用します。現在、より一般的に使用されているものには、Tesseract OCR、OCRopus などが含まれます。

Tesseract OCR は、最も有名な無料の OCR (光学式文字認識、光学式文字認識) エンジンの 1 つです。これは HP Labs によって開発され、現在は Google によって保守されています。 Tesseract は、複数のプラットフォーム (Windows、Mac OS、Linux など) および複数のプログラミング言語 (C、Python、Java など) で利用できます。

次は、Tesseract OCR を使用して画像を認識する簡単な PHP の例です:

  1. Tesseract OCR エンジンと PHP Tesseract OCR パッケージをインストールします

// Tesseract OCR エンジンと PHP Tesseract OCR パッケージをインストールします
apt-get install tesseract-ocr
composer require thiagoalessio/tesseract_ocr

  1. Load image

//Load image
$image = new Imagick('path/to/image');

  1. 画像内のテキストを認識

//画像内のテキストを認識
$ tesseract = new TesseractOCR();
$tesseract->image($image);
$text = $tesseract->run();

echo $text;// 出力テキスト認識

2. PHP テキスト認識

PHP でテキスト認識を実行するには、いくつかのテキスト認識ライブラリを使用します。現在、より一般的に使用されているものには、IDA S.E. OCR、Nanonets OCR などが含まれます。

パッケージによってインストール方法と使用方法が異なるため、Nanonets OCR を例として、Nanonets OCR を使用して画像内のテキストを識別する簡単な PHP の例を以下に示します。アカウントを登録し、API キーとモデル ID を取得します

  1. // アカウントを登録し、API キーとモデル ID を取得します
  2. https://app.nanonets.com/user/register


PHP SDK をインストールします

  1. //PHP SDK をインストールします
  2. composer require nanonets/nanonets-ocr-php


Nanonets OCR から認識結果を取得します

  1. // Nanonets OCR
  2. b166a00dad9e2a582c24692c1f1d407bupload('path / to/image');echo $result;



    分析結果

    1. //分析結果
    2. $json = json_decode($result, true);


      $text = '';
      foreach ($json['result'][0]['prediction'] as $line) {

      $text .= $line['ocr_text'] . "

      ";
      }

      echo $text;

      概要

      上記の 2 つの例を通して、OCR 認識とテキスト認識に PHP を使用していることがわかります。は非常に簡単です。対応するライブラリ (Tesseract OCREngine、OCRopus、Nanonets OCR など) をインストールし、画像をロードまたはアップロードして、結果を解析するだけです。OCR テクノロジとテキスト認識テクノロジは、大規模なデータのデジタル化に役立ちます。紙文書の数を増やすことで管理効率が向上しますが、実際のアプリケーションでは、プロジェクトに適した OCR ライブラリを選択し、実際のニーズに応じて実装する必要があることに注意してください。

    以上がPHP を OCR 認識とテキスト認識に使用するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。