집 >백엔드 개발 >파이썬 튜토리얼 >Python 프로그래밍은 Baidu 텍스트 인식 API 도킹 코드 공유를 구현합니다.

Python 프로그래밍은 Baidu 텍스트 인식 API 도킹 코드 공유를 구현합니다.

王林원래의: 2023-08-25 13:57:071494검색

Baidu Text Recognition API 도킹 코드 공유를 구현하는 Python 프로그래밍

소개: Baidu Text Recognition API는 이미지에서 텍스트를 추출하여 편집 가능한 텍스트로 변환할 수 있는 강력한 텍스트 인식 도구입니다. Python 프로그래밍에서는 Baidu 텍스트 인식 API 도킹 코드를 사용하여 텍스트 인식 기능을 실현할 수 있습니다. 이 기사에서는 텍스트 인식을 위해 Baidu Text Recognition API를 사용하는 방법을 보여주기 위해 간단한 Python 프로그램을 공유합니다.

1. 준비

바이두 클라우드 계정 등록

바이두 문자 인식 API를 사용하기 전에 바이두 클라우드 계정을 등록하고 API 서비스를 활성화해야 합니다.

문자 인식 애플리케이션을 만들고 API 키와 비밀 키를 받으세요

Baidu Cloud 콘솔에서 텍스트 인식 애플리케이션을 만들고 API 키와 비밀 키를 얻습니다. 이 두 매개변수는 API 호출의 핵심입니다.

Python Baidu Cloud SDK 설치

Python Baidu Cloud SDK를 설치하려면 터미널에서 다음 명령을 실행하세요.

pip install baidu-aip

2. 코드 작성

다음은 Baidu 텍스트 인식 사용 방법을 보여주는 간단한 Python 프로그램입니다. 텍스트 인식용 API:

from aip import AipOcr

# 配置百度文字识别API的参数
APP_ID = '您的APP_ID'
API_KEY = '您的API_KEY'
SECRET_KEY = '您的SECRET_KEY'

# 创建一个AipOcr对象
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

# 读取图片文件
def get_file_content(file_path):
    with open(file_path, 'rb') as fp:
        return fp.read()

# 调用百度文字识别API进行文字识别
def recognize_text(image_path):
    # 读取图片文件
    image = get_file_content(image_path)

    # 调用百度文字识别API
    result = client.basicGeneral(image)

    # 解析识别结果
    if 'words_result' in result:
        for word_info in result['words_result']:
            print(word_info['words'])

# 测试代码
if __name__ == '__main__':
    image_path = 'test.png'  # 需要识别的图片文件路径
    recognize_text(image_path)

3. 코드 분석

Baidu 텍스트 인식 API의 매개변수 구성

코드 시작 부분에 자체 APP_ID, API_KEY 및 SECRET_KEY를 입력해야 합니다. Baidu Cloud Console에 저장됩니다. 위 코드의 "your APP_ID", "your API_KEY" 및 "your SECRET_KEY"를 해당 값으로 바꿉니다.

AipOcr 개체 만들기

이후 API 호출에 대해 APP_ID, API_KEY 및 SECRET_KEY를 전달하여 AipOcr 개체를 만듭니다.

이미지 파일 읽기

이미지 파일의 바이너리 콘텐츠를 읽으려면 get_file_content 함수를 작성하세요. Baidu 텍스트 인식 API를 호출할 때 이미지 파일을 바이너리 형식으로 변환해야 합니다. get_file_content，用于读取图片文件的二进制内容。在调用百度文字识别API时，需要将图片文件转化为二进制格式。

调用百度文字识别API进行文字识别

编写一个函数recognize_text，用于调用百度文字识别API进行文字识别。在函数内部，我们先读取图片文件的二进制内容，然后调用client.basicGeneral方法，传入图片内容进行文字识别。

解析识别结果

输出识别结果，遍历识别结果中的每个词块，将其中的文字信息打印出来。

四、测试运行

将需要识别的图片文件放在代码中指定的路径，替换变量image_path

텍스트 인식을 위해 Baidu 텍스트 인식 API를 호출하려면 recognize_text 함수를 작성하세요. 함수 내에서 먼저 이미지 파일의 바이너리 콘텐츠를 읽은 다음 client.basicGeneral 메서드를 호출하여 텍스트 인식을 위해 이미지 콘텐츠를 전달합니다.

image_path

위 내용은 Python 프로그래밍은 Baidu 텍스트 인식 API 도킹 코드 공유를 구현합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

Python 对象

성명：

이전 기사：Python 프로그래밍을 사용하여 Baidu의 음성 인식 인터페이스 도킹을 구현하여 프로그램이 음성 콘텐츠를 정확하게 인식할 수 있도록 합니다.다음 기사：Python 프로그래밍을 사용하여 Baidu의 음성 인식 인터페이스 도킹을 구현하여 프로그램이 음성 콘텐츠를 정확하게 인식할 수 있도록 합니다.