>  기사  >  백엔드 개발  >  PHP와 Alibaba Cloud OCR을 사용하여 테이블 텍스트를 추출하는 방법은 무엇입니까?

PHP와 Alibaba Cloud OCR을 사용하여 테이블 텍스트를 추출하는 방법은 무엇입니까?

WBOY
WBOY원래의
2023-07-18 17:18:191023검색

PHP와 Alibaba Cloud OCR을 사용하여 테이블 텍스트 추출 기능을 구현하는 방법은 무엇입니까?

Alibaba Cloud OCR(광학 문자 인식)은 사진이나 스캔한 문서에서 텍스트 정보를 추출하는 데 사용할 수 있는 강력한 텍스트 인식 기술입니다. 널리 사용되는 서버 측 스크립팅 언어인 PHP는 Alibaba Cloud OCR API와 상호 작용하여 테이블 텍스트 추출 기능을 구현할 수 있습니다. 이 글에서는 PHP와 Alibaba Cloud OCR을 사용하여 이 기능을 구현하는 방법을 자세히 소개하고 코드 예제를 제공합니다.

  1. Alibaba Cloud OCR API 구성

먼저 Alibaba Cloud 공식 웹사이트에 계정을 등록하고 OCR 서비스를 활성화해야 합니다. 그런 다음 Alibaba Cloud 콘솔에 로그인하고 OCR 서비스 페이지에서 액세스 키 ID와 액세스 키 비밀번호를 얻으세요. 이 정보는 후속 API 요청에 사용됩니다.

  1. PHP SDK 설치

Alibaba Cloud에서는 Composer를 통해 설치할 수 있는 PHP SDK를 공식적으로 제공합니다. 명령줄에서 다음 명령을 실행합니다.

composer require alibabacloud/sdk
  1. PHP 파일 만들기

"extract_table.php"라는 PHP 파일을 만들고 파일 시작 부분에 Alibaba Cloud OCR SDK를 도입합니다.

require 'vendor/autoload.php';
use AlibabaCloudClientAlibabaCloud;
use AlibabaCloudClientExceptionClientException;
use AlibabaCloudClientExceptionServerException;
  1. Connect to Alibaba Cloud OCR API

파일에 다음 코드를 추가하여 Alibaba Cloud OCR API에 연결하고 인증을 수행하세요.

AlibabaCloud::accessKeyClient('your_access_key_id', 'your_access_key_secret')
    ->regionId('your_region_id') // 例如:cn-shanghai
    ->asDefaultClient();

"your_access_key_id" 및 "your_access_key_secret"를 Alibaba에서 얻은 액세스 키 ID 및 "your_access_key_secret"으로 바꾸세요. Cloud 콘솔 액세스 키 비밀번호입니다. 동시에 "your_region_id"를 해당 지역의 지역 ID(예: cn-shanghai)로 바꾸십시오.

  1. 텍스트 추출 작업 수행

테이블 텍스트 추출 기능을 구현하려면 파일에 다음 코드를 추가하세요.

try {
    $response = AlibabaCloud::ocr()
        ->v20191230()
        ->recognizeTable()
        ->withImageUrl('your_image_url')
        ->debug(true) // 可选:打开调试模式,便于定位问题
        ->timeout(3) // 可选:设置请求超时时间(单位:秒)
        ->connectTimeout(3) // 可选:设置连接超时时间(单位:秒)
        ->request();
    
    // 解析API返回结果
    $result = json_decode($response->getBody(), true);
    $tables = $result['Data']['Tables'];
    
    // 输出提取到的文字
    foreach ($tables as $table) {
        foreach ($table['Result']['TableCells'] as $cell) {
            echo $cell['Text'];
        }
    }
    
} catch (ClientException $e) {
    // 处理客户端异常
    echo $e->getErrorMessage();
} catch (ServerException $e) {
    // 处理服务端异常
    echo $e->getErrorMessage();
}

"your_image_url"을 텍스트를 추출하려는 이미지의 URL로 바꾸세요.

  1. PHP 파일 실행

"extract_table.php" 파일을 저장하고 닫은 후 명령줄에서 다음 명령을 실행하여 PHP 파일을 실행합니다.

php extract_table.php

이때 PHP는 다음으로 요청을 보냅니다. Alibaba Cloud OCR API를 사용하여 테이블의 텍스트를 추출하고 결과를 명령줄 창에 출력합니다.

위 단계를 통해 PHP 및 Alibaba Cloud OCR API를 사용하여 테이블 텍스트 추출 기능을 구현할 수 있습니다. 실제 필요에 따라 추출된 텍스트를 파일에 저장하거나 후속 데이터 처리에 사용할 수 있습니다. 이 기사가 도움이 되기를 바랍니다!

위 내용은 PHP와 Alibaba Cloud OCR을 사용하여 테이블 텍스트를 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.