Maison > Article > développement back-end > Comment utiliser PHP et Alibaba Cloud OCR pour extraire le texte d'un tableau ?
Comment utiliser PHP et Alibaba Cloud OCR pour implémenter la fonction d'extraction de texte de tableau ?
Alibaba Cloud OCR (Optical Character Recognition) est une puissante technologie de reconnaissance de texte qui peut être utilisée pour extraire des informations textuelles à partir d'images ou de documents numérisés. En tant que langage de script côté serveur populaire, PHP peut interagir avec l'API Alibaba Cloud OCR pour implémenter des fonctions d'extraction de texte de tableau. Cet article présentera en détail comment utiliser PHP et Alibaba Cloud OCR pour implémenter cette fonction et fournira des exemples de code.
Tout d'abord, vous devez créer un compte sur le site officiel d'Alibaba Cloud et activer le service OCR. Ensuite, connectez-vous à la console Alibaba Cloud et obtenez l'ID de clé d'accès et le secret de clé d'accès sur la page du service OCR. Ces informations seront utilisées pour les demandes d'API ultérieures.
Alibaba Cloud fournit officiellement le SDK PHP, que vous pouvez installer via Composer. Exécutez la commande suivante dans la ligne de commande :
composer require alibabacloud/sdk
Créez un fichier PHP nommé "extract_table.php" et introduisez le SDK Alibaba Cloud OCR au début du fichier :
require 'vendor/autoload.php'; use AlibabaCloudClientAlibabaCloud; use AlibabaCloudClientExceptionClientException; use AlibabaCloudClientExceptionServerException;
Ajoutez le code suivant dans le fichier pour vous connecter à l'API OCR d'Alibaba Cloud et effectuer l'authentification :
AlibabaCloud::accessKeyClient('your_access_key_id', 'your_access_key_secret') ->regionId('your_region_id') // 例如:cn-shanghai ->asDefaultClient();
Veuillez remplacer "your_access_key_id" et "your_access_key_secret" par l'ID de clé d'accès et "your_access_key_secret" que vous avez obtenus dans Alibaba. Clé secrète d'accès à la console Cloud. Dans le même temps, veuillez remplacer « your_region_id » par l'identifiant de votre région (par exemple : cn-shanghai).
Ajoutez le code suivant dans le fichier pour implémenter la fonction d'extraction de texte du tableau :
try { $response = AlibabaCloud::ocr() ->v20191230() ->recognizeTable() ->withImageUrl('your_image_url') ->debug(true) // 可选:打开调试模式,便于定位问题 ->timeout(3) // 可选:设置请求超时时间(单位:秒) ->connectTimeout(3) // 可选:设置连接超时时间(单位:秒) ->request(); // 解析API返回结果 $result = json_decode($response->getBody(), true); $tables = $result['Data']['Tables']; // 输出提取到的文字 foreach ($tables as $table) { foreach ($table['Result']['TableCells'] as $cell) { echo $cell['Text']; } } } catch (ClientException $e) { // 处理客户端异常 echo $e->getErrorMessage(); } catch (ServerException $e) { // 处理服务端异常 echo $e->getErrorMessage(); }
Veuillez remplacer "votre_image_url" par l'URL de l'image dont vous souhaitez extraire le texte.
Enregistrez et fermez le fichier "extract_table.php", puis exécutez la commande suivante sur la ligne de commande pour exécuter le fichier PHP :
php extract_table.php
À ce moment, PHP enverra une requête à l'API Alibaba Cloud OCR pour extraire le texte du tableau et afficher les résultats dans la fenêtre de ligne de commande.
Après les étapes ci-dessus, vous pouvez utiliser PHP et l'API Alibaba Cloud OCR pour implémenter la fonction d'extraction de texte de tableau. En fonction de vos besoins réels, vous pouvez enregistrer le texte extrait dans un fichier ou l'utiliser pour un traitement ultérieur des données. J'espère que cet article vous sera utile !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!