Rumah > Artikel > pembangunan bahagian belakang > Bagaimana untuk menggunakan PHP dan Alibaba Cloud OCR untuk mengekstrak teks jadual?
Bagaimana untuk menggunakan PHP dan Alibaba Cloud OCR untuk melaksanakan fungsi pengekstrakan teks jadual?
Alibaba Cloud OCR (Optical Character Recognition) ialah teknologi pengecaman teks yang berkuasa yang boleh digunakan untuk mengekstrak maklumat teks daripada gambar atau dokumen yang diimbas. Sebagai bahasa skrip sebelah pelayan yang popular, PHP boleh berinteraksi dengan API Alibaba Cloud OCR untuk melaksanakan fungsi pengekstrakan teks jadual. Artikel ini akan memperkenalkan secara terperinci cara menggunakan PHP dan Alibaba Cloud OCR untuk melaksanakan fungsi ini, dan memberikan contoh kod.
Pertama, anda perlu mendaftar akaun di laman web rasmi Alibaba Cloud dan mengaktifkan perkhidmatan OCR. Kemudian, log masuk ke konsol Awan Alibaba dan dapatkan ID Kunci Akses dan Rahsia Kunci Akses pada halaman perkhidmatan OCR Maklumat ini akan digunakan untuk permintaan API berikutnya.
Alibaba Cloud secara rasmi menyediakan PHP SDK, yang boleh anda pasang melalui Composer. Jalankan arahan berikut dalam baris arahan:
composer require alibabacloud/sdk
Buat fail PHP bernama "extract_table.php" dan perkenalkan Alibaba Cloud OCR SDK pada permulaan fail:
rreeeTambahkan kod berikut dalam fail untuk menyambung ke Alibaba Cloud OCR API dan lakukan pengesahan:
require 'vendor/autoload.php'; use AlibabaCloudClientAlibabaCloud; use AlibabaCloudClientExceptionClientException; use AlibabaCloudClientExceptionServerException;
Sila gantikan "your_access_key_id" dan "your_access_key_secret" dengan Access Key ID dan "your_access_key_secret" yang anda perolehi Rahsia Kunci Akses Konsol awan. Pada masa yang sama, sila gantikan "your_region_id" dengan ID wilayah rantau anda (contohnya: cn-shanghai).
Tambahkan kod berikut dalam fail untuk melaksanakan fungsi pengekstrakan teks jadual:
AlibabaCloud::accessKeyClient('your_access_key_id', 'your_access_key_secret') ->regionId('your_region_id') // 例如:cn-shanghai ->asDefaultClient();
Sila gantikan "url_imej_anda" dengan URL imej yang ingin anda ekstrak teks.
Simpan dan tutup fail "extract_table.php", dan kemudian laksanakan arahan berikut pada baris arahan untuk menjalankan fail PHP:
try { $response = AlibabaCloud::ocr() ->v20191230() ->recognizeTable() ->withImageUrl('your_image_url') ->debug(true) // 可选:打开调试模式,便于定位问题 ->timeout(3) // 可选:设置请求超时时间(单位:秒) ->connectTimeout(3) // 可选:设置连接超时时间(单位:秒) ->request(); // 解析API返回结果 $result = json_decode($response->getBody(), true); $tables = $result['Data']['Tables']; // 输出提取到的文字 foreach ($tables as $table) { foreach ($table['Result']['TableCells'] as $cell) { echo $cell['Text']; } } } catch (ClientException $e) { // 处理客户端异常 echo $e->getErrorMessage(); } catch (ServerException $e) { // 处理服务端异常 echo $e->getErrorMessage(); }
Pada masa ini, PHP akan menghantar permintaan kepada API OCR Awan Alibaba untuk mengekstrak teks dalam jadual dan mengeluarkan hasilnya ke tetingkap baris arahan.
Selepas langkah di atas, anda boleh menggunakan PHP dan Alibaba Cloud OCR API untuk melaksanakan fungsi pengekstrakan teks jadual. Bergantung pada keperluan sebenar anda, anda boleh menyimpan teks yang diekstrak ke fail atau menggunakannya untuk pemprosesan data seterusnya. Semoga artikel ini dapat membantu anda!
Atas ialah kandungan terperinci Bagaimana untuk menggunakan PHP dan Alibaba Cloud OCR untuk mengekstrak teks jadual?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!