Heim  >  Artikel  >  Backend-Entwicklung  >  Wie verwende ich PHP und Alibaba Cloud OCR, um Tabellentext zu extrahieren?

Wie verwende ich PHP und Alibaba Cloud OCR, um Tabellentext zu extrahieren?

WBOY
WBOYOriginal
2023-07-18 17:18:191037Durchsuche

Wie verwende ich PHP und Alibaba Cloud OCR, um die Funktion zur Tabellentextextraktion zu implementieren?

Alibaba Cloud OCR (Optical Character Recognition) ist eine leistungsstarke Texterkennungstechnologie, mit der Textinformationen aus Bildern oder gescannten Dokumenten extrahiert werden können. Als beliebte serverseitige Skriptsprache kann PHP mit der Alibaba Cloud OCR-API interagieren, um Funktionen zur Tabellentextextraktion zu implementieren. In diesem Artikel wird detailliert beschrieben, wie PHP und Alibaba Cloud OCR zum Implementieren dieser Funktion verwendet werden, und es werden Codebeispiele bereitgestellt.

  1. Konfigurieren Sie die Alibaba Cloud OCR-API

Zuerst müssen Sie ein Konto auf der offiziellen Website von Alibaba Cloud registrieren und den OCR-Dienst aktivieren. Melden Sie sich dann bei der Alibaba Cloud-Konsole an und rufen Sie die Zugriffsschlüssel-ID und das Zugriffsschlüsselgeheimnis auf der OCR-Dienstseite ab. Diese Informationen werden für nachfolgende API-Anfragen verwendet.

  1. PHP SDK installieren

Alibaba Cloud stellt offiziell PHP SDK zur Verfügung, das Sie über Composer installieren können. Führen Sie den folgenden Befehl in der Befehlszeile aus:

composer require alibabacloud/sdk
  1. PHP-Datei erstellen

Erstellen Sie eine PHP-Datei mit dem Namen „extract_table.php“ und führen Sie Alibaba Cloud OCR SDK am Anfang der Datei ein:

require 'vendor/autoload.php';
use AlibabaCloudClientAlibabaCloud;
use AlibabaCloudClientExceptionClientException;
use AlibabaCloudClientExceptionServerException;
  1. Mit Alibaba Cloud verbinden OCR-API

Fügen Sie den folgenden Code in die Datei ein, um eine Verbindung zur Alibaba Cloud OCR-API herzustellen und die Authentifizierung durchzuführen:

AlibabaCloud::accessKeyClient('your_access_key_id', 'your_access_key_secret')
    ->regionId('your_region_id') // 例如:cn-shanghai
    ->asDefaultClient();

Bitte ersetzen Sie „your_access_key_id“ und „your_access_key_secret“ durch die Zugriffsschlüssel-ID und „your_access_key_secret“, die Sie in Alibaba erhalten haben Schlüsselgeheimnis für den Zugriff auf die Cloud-Konsole. Ersetzen Sie gleichzeitig „your_region_id“ durch die Regions-ID Ihrer Region (zum Beispiel: cn-shanghai).

  1. Textextraktionsvorgang ausführen

Fügen Sie den folgenden Code in die Datei ein, um die Tabellentextextraktionsfunktion zu implementieren:

try {
    $response = AlibabaCloud::ocr()
        ->v20191230()
        ->recognizeTable()
        ->withImageUrl('your_image_url')
        ->debug(true) // 可选:打开调试模式,便于定位问题
        ->timeout(3) // 可选:设置请求超时时间(单位:秒)
        ->connectTimeout(3) // 可选:设置连接超时时间(单位:秒)
        ->request();
    
    // 解析API返回结果
    $result = json_decode($response->getBody(), true);
    $tables = $result['Data']['Tables'];
    
    // 输出提取到的文字
    foreach ($tables as $table) {
        foreach ($table['Result']['TableCells'] as $cell) {
            echo $cell['Text'];
        }
    }
    
} catch (ClientException $e) {
    // 处理客户端异常
    echo $e->getErrorMessage();
} catch (ServerException $e) {
    // 处理服务端异常
    echo $e->getErrorMessage();
}

Bitte ersetzen Sie „your_image_url“ durch die URL des Bildes, aus dem Sie Text extrahieren möchten.

  1. Führen Sie die PHP-Datei aus

Speichern und schließen Sie die Datei „extract_table.php“ und führen Sie dann den folgenden Befehl in der Befehlszeile aus, um die PHP-Datei auszuführen:

php extract_table.php

Zu diesem Zeitpunkt sendet PHP eine Anfrage an die Alibaba Cloud OCR-API, um Text in der Tabelle zu extrahieren und die Ergebnisse im Befehlszeilenfenster auszugeben.

Nach den obigen Schritten können Sie PHP und die Alibaba Cloud OCR-API verwenden, um die Tabellentextextraktionsfunktion zu implementieren. Abhängig von Ihrem tatsächlichen Bedarf können Sie den extrahierten Text in einer Datei speichern oder für die spätere Datenverarbeitung verwenden. Ich hoffe, dieser Artikel ist hilfreich für Sie!

Das obige ist der detaillierte Inhalt vonWie verwende ich PHP und Alibaba Cloud OCR, um Tabellentext zu extrahieren?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn