Rumah >pembangunan bahagian belakang >tutorial php >Bagaimana untuk menggunakan PHP dan Alibaba Cloud OCR untuk mengekstrak teks jadual?

Bagaimana untuk menggunakan PHP dan Alibaba Cloud OCR untuk mengekstrak teks jadual?

WBOY
WBOYasal
2023-07-18 17:18:191090semak imbas

Bagaimana untuk menggunakan PHP dan Alibaba Cloud OCR untuk melaksanakan fungsi pengekstrakan teks jadual?

Alibaba Cloud OCR (Optical Character Recognition) ialah teknologi pengecaman teks yang berkuasa yang boleh digunakan untuk mengekstrak maklumat teks daripada gambar atau dokumen yang diimbas. Sebagai bahasa skrip sebelah pelayan yang popular, PHP boleh berinteraksi dengan API Alibaba Cloud OCR untuk melaksanakan fungsi pengekstrakan teks jadual. Artikel ini akan memperkenalkan secara terperinci cara menggunakan PHP dan Alibaba Cloud OCR untuk melaksanakan fungsi ini, dan memberikan contoh kod.

  1. Konfigurasi Alibaba Cloud OCR API

Pertama, anda perlu mendaftar akaun di laman web rasmi Alibaba Cloud dan mengaktifkan perkhidmatan OCR. Kemudian, log masuk ke konsol Awan Alibaba dan dapatkan ID Kunci Akses dan Rahsia Kunci Akses pada halaman perkhidmatan OCR Maklumat ini akan digunakan untuk permintaan API berikutnya.

  1. Pasang PHP SDK

Alibaba Cloud secara rasmi menyediakan PHP SDK, yang boleh anda pasang melalui Composer. Jalankan arahan berikut dalam baris arahan:

composer require alibabacloud/sdk
  1. Buat fail PHP

Buat fail PHP bernama "extract_table.php" dan perkenalkan Alibaba Cloud OCR SDK pada permulaan fail:

rreee
  1. Sambung ke Alibaba Cloud OCR API

Tambahkan kod berikut dalam fail untuk menyambung ke Alibaba Cloud OCR API dan lakukan pengesahan:

require 'vendor/autoload.php';
use AlibabaCloudClientAlibabaCloud;
use AlibabaCloudClientExceptionClientException;
use AlibabaCloudClientExceptionServerException;

Sila gantikan "your_access_key_id" dan "your_access_key_secret" dengan Access Key ID dan "your_access_key_secret" yang anda perolehi Rahsia Kunci Akses Konsol awan. Pada masa yang sama, sila gantikan "your_region_id" dengan ID wilayah rantau anda (contohnya: cn-shanghai).

  1. Lakukan operasi pengekstrakan teks

Tambahkan kod berikut dalam fail untuk melaksanakan fungsi pengekstrakan teks jadual:

AlibabaCloud::accessKeyClient('your_access_key_id', 'your_access_key_secret')
    ->regionId('your_region_id') // 例如:cn-shanghai
    ->asDefaultClient();

Sila gantikan "url_imej_anda" dengan URL imej yang ingin anda ekstrak teks.

  1. Jalankan fail PHP

Simpan dan tutup fail "extract_table.php", dan kemudian laksanakan arahan berikut pada baris arahan untuk menjalankan fail PHP:

try {
    $response = AlibabaCloud::ocr()
        ->v20191230()
        ->recognizeTable()
        ->withImageUrl('your_image_url')
        ->debug(true) // 可选:打开调试模式,便于定位问题
        ->timeout(3) // 可选:设置请求超时时间(单位:秒)
        ->connectTimeout(3) // 可选:设置连接超时时间(单位:秒)
        ->request();
    
    // 解析API返回结果
    $result = json_decode($response->getBody(), true);
    $tables = $result['Data']['Tables'];
    
    // 输出提取到的文字
    foreach ($tables as $table) {
        foreach ($table['Result']['TableCells'] as $cell) {
            echo $cell['Text'];
        }
    }
    
} catch (ClientException $e) {
    // 处理客户端异常
    echo $e->getErrorMessage();
} catch (ServerException $e) {
    // 处理服务端异常
    echo $e->getErrorMessage();
}

Pada masa ini, PHP akan menghantar permintaan kepada API OCR Awan Alibaba untuk mengekstrak teks dalam jadual dan mengeluarkan hasilnya ke tetingkap baris arahan.

Selepas langkah di atas, anda boleh menggunakan PHP dan Alibaba Cloud OCR API untuk melaksanakan fungsi pengekstrakan teks jadual. Bergantung pada keperluan sebenar anda, anda boleh menyimpan teks yang diekstrak ke fail atau menggunakannya untuk pemprosesan data seterusnya. Semoga artikel ini dapat membantu anda!

Atas ialah kandungan terperinci Bagaimana untuk menggunakan PHP dan Alibaba Cloud OCR untuk mengekstrak teks jadual?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn