ホームページ >バックエンド開発 >PHPチュートリアル >PHP の OCR 認識テクノロジー ガイド

PHP の OCR 認識テクノロジー ガイド

王林
王林オリジナル
2023-05-20 23:12:041897ブラウズ

デジタル時代の到来により、多くの企業や個人は紙の文書をデジタル化する必要があります。 OCR(Optical Character Recognition、光学式文字認識)認識技術は、この問題を解決する有効な方法の 1 つです。 PHP は、一般的なサーバーサイド言語として、OCR 認識用のライブラリとツールもいくつか提供しています。この記事では、最適なソリューションを選択するために、PHP の複数の OCR 認識テクノロジを紹介します。

1. tesseract-ocr

tesseract-ocr は、C で書かれた人気のオープンソース OCR エンジン ライブラリです。 PHP は tesseract-ocr との統合を提供します。 PDF、JPEG、GIF、PNG およびその他の形式の画像は、php-ext-tesseract を通じて認識できます。 tesseract-ocrの最大の特徴は、多言語対応に設計されており、世界中のほとんどの言語のテキストを認識できることです。

使用法:

<?php
    require_once __DIR__.'/vendor/autoload.php';
    use thiagoalessioTesseractOCRTesseractOCR;

    $result = (new TesseractOCR('example.png'))
                    ->run();
    echo $result;
?>

2. OCRopus

OCRopus は、Python をベースにした OCR ツールとライブラリ、および人気のある OCR エンジンのセットです。 OCRopus は PHP バインディング操作を使用できます。テキスト認識をサポートするだけでなく、文書の分類、セグメンテーション、植字などの包括的な OCR 処理タスクも実行します。

使用法:

<?php
    $image = new Imagick();
    $image->readImage('example.png');
    $image->setImageFormat('tif');
    $image->thresholdImage(127); //图像二值化
    $data = $image->getImagesBlob();
    $ocr = new     esseractOCR($data);
    echo $ocr->run();
?>

3. Google Cloud Vision OCR

Google Cloud Vision API は、OCR サービスを統合するマシン ビジョン ツールのセットです。この API は、コンピューター ビジョン機能と画像認識を提供します。Google Cloud Vision OCR は、画像内のテキストや文字の識別に役立ちます。なお、このサービスの利用にはGoogleアカウントの登録とAPIキーの取得が必要で、利用回数に応じて課金される。

使用法:

<?php
    require_once __DIR__ . '/vendor/autoload.php';
    use GoogleCloudVisionV1ImageAnnotatorClient;

    $imageAnnotator = new ImageAnnotatorClient();

    try {
        # 图像文件的本地路径或者 URL 地址,即待识别的图像文件路径
        $image = file_get_contents('https://example.com/image.jpg');
        # 构建图像标注请求
        $response = $imageAnnotator->documentTextDetection($image);
        # 输出结果
        foreach ($response->getTextAnnotations() as $text) {
            printf('%s' . PHP_EOL, $text->getDescription());
        }
    } catch (Exception $exception) {
        echo $exception->getMessage();
    }
?>

上記は、PHP でよく使用される 3 つの OCR テクノロジです。もちろん、OCR 画像認識に他のライブラリや API を使用することもできます。これらのテクノロジーにはそれぞれ長所と短所があり、特定のニーズに基づいて選択する必要があります。どの方法を選択しても、紙の文書を迅速かつ正確にデジタル化し、作業効率を向上させ、コストを削減し、企業や個人に真の価値をもたらすのに役立ちます。

以上がPHP の OCR 認識テクノロジー ガイドの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。