집 >백엔드 개발 >파이썬 튜토리얼 >튜토리얼: Python은 Huawei Cloud 인터페이스에 연결하여 OCR 텍스트 인식을 구현합니다.

튜토리얼: Python은 Huawei Cloud 인터페이스에 연결하여 OCR 텍스트 인식을 구현합니다.

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB원래의: 2023-07-05 13:28:371169검색

튜토리얼: Python은 Huawei Cloud 인터페이스에 연결하여 OCR 텍스트 인식을 구현합니다

먼저, 이 튜토리얼에서는 Python 프로그래밍 언어를 사용하여 Huawei Cloud 인터페이스에 연결하고 OCR(광학 문자 인식, 광학 문자 인식)을 사용하는 방법을 배웁니다. ) 텍스트 식별 기능을 구현하는 기술입니다. OCR 기술은 이미지의 텍스트를 편집 및 검색 가능한 전자 텍스트로 변환할 수 있으며 이는 다양한 텍스트 인식 시나리오에 매우 적합합니다.

준비
시작하기 전에 다음 준비를 완료해야 합니다.
Huawei Cloud 계정 등록 및 로그인(https://www.huaweicloud.com/)
OCR 서비스 인스턴스를 생성하고 해당 API 키 및 서비스 엔드포인트(Endpoint)
종속 라이브러리 설치
Huawei Cloud 인터페이스에 연결하기 전에 Python의 요청 라이브러리를 사용하여 HTTP 요청을 보내야 합니다. 요청 라이브러리를 설치하지 않은 경우 다음 명령을 통해 설치할 수 있습니다.
```
$ pip install requests
```
Python 코드 작성

먼저 요청 라이브러리를 가져오고 몇 가지 상수 변수를 정의해야 합니다.

import requests

# 华为云OCR服务端点
ENDPOINT = 'https://ocr.cn-north-4.myhuaweicloud.com'

# 替换成你的API密钥
API_KEY = 'your_api_key'
API_SECRET = 'your_api_secret'

OCR 텍스트 구현 인식 기능

다음으로 OCR 텍스트 인식 기능을 구현할 수 있습니다. 인식할 이미지를 서버에 업로드하고 Huawei Cloud API에 요청을 보내 텍스트 인식 결과를 얻을 수 있습니다.

def recognize_text(image_path):
    url = f'{ENDPOINT}/v1.0/ocr/general-text'
    headers = {
        'Content-Type': 'application/json',
        'X-Auth-Token': 'Token ' + get_auth_token()
    }
    data = {
        "url": image_path
    }
    response = requests.post(url, headers=headers, json=data)
    result = response.json()

    if 'result' in result:
        text = ""
        for item in result['result']['words_block_list']:
            text += item['words'] + ' '
        return text
    else:
        return None


def get_auth_token():
    url = 'https://iam.cn-north-4.myhuaweicloud.com/v3/auth/tokens'
    headers = {
        'Content-Type': 'application/json'
    }
    data = {
        "auth": {
            "identity": {
                "methods": [
                    "password"
                ],
                "password": {
                    "user": {
                        "name": API_KEY,
                        "password": API_SECRET,
                        "domain": {
                            "name": "hwid"
                        }
                    }
                }
            },
            "scope": {
                "project": {
                    "name": "cn-north-4"
                }
            }
        }
    }
    response = requests.post(url, headers=headers, json=data)

    if 'X-Subject-Token' in response.headers:
        return response.headers['X-Subject-Token']
    else:
        return None


# 使用示例
image_path = '/path/to/your/image.jpg'
result = recognize_text(image_path)
if result:
    print('文字识别结果：', result)
else:
    print('识别失败')

위 코드 예제에서는 이미지 파일의 경로를 매개변수로 받고 인식된 텍스트 결과를 반환하는 recognize_text 함수를 정의했습니다. Huawei Cloud의 OCR 인터페이스에 HTTP POST 요청을 보내고 이미지의 URL을 JSON 데이터 형식으로 API에 보냅니다.

API에서 반환되는 결과는 JSON 형식의 데이터입니다. JSON 데이터를 구문 분석하여 텍스트 인식 결과를 추출합니다.

참고: 코드 예제에서는 준비 작업에서 얻은 API 키와 서비스 엔드포인트를 사용합니다. 이를 자신의 API 키로 바꾸십시오.

요약
이 튜토리얼을 통해 Python을 사용하여 Huawei Cloud의 OCR 인터페이스에 연결하고 텍스트 인식 기능을 구현하는 방법을 배웠습니다. OCR 기술은 문서 스캔, 번호판 인식, 이미지 번역 등과 같은 다양한 시나리오에서 널리 사용됩니다. 실제 요구 사항에 따라 더 복잡한 인식 요구 사항을 충족하도록 코드를 추가로 조정할 수 있습니다.

위 내용은 튜토리얼: Python은 Huawei Cloud 인터페이스에 연결하여 OCR 텍스트 인식을 구현합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명：

이전 기사：Python은 Alibaba Cloud 인터페이스를 호출하여 비정상적인 모니터링 및 경보 기능을 구현합니다.다음 기사：Python은 Alibaba Cloud 인터페이스를 호출하여 비정상적인 모니터링 및 경보 기능을 구현합니다.