>백엔드 개발 >파이썬 튜토리얼 >Python은 Alibaba Cloud 인터페이스를 호출하여 OCR 텍스트 추출 기능을 구현합니다.

Python은 Alibaba Cloud 인터페이스를 호출하여 OCR 텍스트 추출 기능을 구현합니다.

王林
王林원래의
2023-07-05 21:49:352049검색

Python은 Alibaba Cloud 인터페이스를 호출하여 OCR 텍스트 추출 기능을 구현합니다.

Alibaba Cloud는 OCR(광학 문자 인식) 텍스트 인식 인터페이스를 포함한 일련의 강력한 API를 제공합니다. 이 인터페이스를 통해 우리는 사진 속의 텍스트를 식별할 수 있는데, 이는 종이 문서의 텍스트를 전자 텍스트로 변환하는 것과 같은 일부 텍스트 추출 시나리오에 매우 적합합니다.

이 글에서는 Python에서 Alibaba Cloud의 OCR 인터페이스를 호출하고 텍스트 추출 기능을 구현하는 방법을 소개합니다. 구체적인 단계는 다음과 같습니다.

1단계: Alibaba Cloud SDK 설치

Alibaba Cloud의 API 인터페이스를 호출하려면 먼저 해당 SDK를 설치해야 합니다. Python에서는 pip 명령을 통해 Alibaba Cloud SDK를 설치할 수 있습니다.

터미널을 열고 다음 명령을 입력하세요:

pip install aliyun-python-sdk-core
pip install aliyun-python-sdk-ocr

2단계: 액세스 키 및 비밀 키 얻기

Alibaba Cloud의 API를 호출하려면 액세스 키와 비밀 키를 제공해야 합니다. Alibaba Cloud 콘솔에서 이 두 가지 주요 정보를 신청하고 얻을 수 있습니다. 이 두 가지 정보를 모두 안전한 곳에 보관하십시오.

3단계: OCR 인터페이스를 호출하는 코드 작성

먼저 관련 라이브러리를 가져와야 합니다:

import base64
import json
import urllib
import urllib.request
from aliyunsdkcore import client
from aliyunsdkocr.request.v20191230 import RecognizeCharacterRequest

다음으로 Alibaba Cloud 클라이언트를 초기화합니다:

def create_aliyun_client():
    access_key = "<Your Access Key>"
    secret_key = "<Your Secret Key>"
    region_id = "cn-hangzhou"
    return client.AcsClient(access_key, secret_key, region_id)

그런 다음 OCR 인터페이스를 호출하는 함수를 작성합니다:

def ocr_character(image_path):
    app_key = "<Your App Key>"
    request = RecognizeCharacterRequest.RecognizeCharacterRequest()
    request.set_accept_format('json')
    with open(image_path, 'rb') as file:
        image_data = file.read()
        base64_data = base64.b64encode(image_data)
        request.set_ImageURL(base64_data)
    response = create_aliyun_client().do_action_with_exception(request)
    result = json.loads(response)
    print(result)

위 코드에서 Access Key, Secret Key, App Key를 교체하고 식별하려는 이미지의 경로를 전달해야 합니다.

마지막으로 ocr_character 함수를 호출하고 식별해야 하는 이미지의 경로를 전달합니다.

if __name__ == "__main__":
    image_path = "<Your Image Path>"
    ocr_character(image_path)

여기서는 이미지의 로컬 경로가 사용된다는 점에 유의하세요. 인터넷에서 이미지를 식별하려면 해당 URL을 사용해야 합니다. 또한 Alibaba Cloud의 OCR 인터페이스는 현재 제한된 이미지 형식을 지원합니다. 일반적으로 JPEG 또는 PNG 형식의 이미지를 사용하는 것이 좋습니다.

요약:

이 글에서는 Python을 사용하여 Alibaba Cloud의 OCR 인터페이스를 호출하여 텍스트 추출 기능을 구현하는 방법을 소개합니다. 이 인터페이스를 통해 사진 속 텍스트를 전자 텍스트로 쉽게 변환할 수 있어 작업 효율성이 향상되고 일부 수동 전사 작업이 단순화됩니다.

이 기사가 도움이 되기를 바랍니다!

위 내용은 Python은 Alibaba Cloud 인터페이스를 호출하여 OCR 텍스트 추출 기능을 구현합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.