>  기사  >  백엔드 개발  >  Python 프로그래밍은 Baidu 텍스트 인식 API 도킹 코드 공유를 구현합니다.

Python 프로그래밍은 Baidu 텍스트 인식 API 도킹 코드 공유를 구현합니다.

王林
王林원래의
2023-08-25 13:57:071314검색

Python 프로그래밍은 Baidu 텍스트 인식 API 도킹 코드 공유를 구현합니다.

Baidu Text Recognition API 도킹 코드 공유를 구현하는 Python 프로그래밍

소개: Baidu Text Recognition API는 이미지에서 텍스트를 추출하여 편집 가능한 텍스트로 변환할 수 있는 강력한 텍스트 인식 도구입니다. Python 프로그래밍에서는 Baidu 텍스트 인식 API 도킹 코드를 사용하여 텍스트 인식 기능을 실현할 수 있습니다. 이 기사에서는 텍스트 인식을 위해 Baidu Text Recognition API를 사용하는 방법을 보여주기 위해 간단한 Python 프로그램을 공유합니다.

1. 준비

  1. 바이두 클라우드 계정 등록

바이두 문자 인식 API를 사용하기 전에 바이두 클라우드 계정을 등록하고 API 서비스를 활성화해야 합니다.

  1. 문자 인식 애플리케이션을 만들고 API 키와 비밀 키를 받으세요

Baidu Cloud 콘솔에서 텍스트 인식 애플리케이션을 만들고 API 키와 비밀 키를 얻습니다. 이 두 매개변수는 API 호출의 핵심입니다.

  1. Python Baidu Cloud SDK 설치

Python Baidu Cloud SDK를 설치하려면 터미널에서 다음 명령을 실행하세요.

pip install baidu-aip

2. 코드 작성

다음은 Baidu 텍스트 인식 사용 방법을 보여주는 간단한 Python 프로그램입니다. 텍스트 인식용 API:

from aip import AipOcr

# 配置百度文字识别API的参数
APP_ID = '您的APP_ID'
API_KEY = '您的API_KEY'
SECRET_KEY = '您的SECRET_KEY'

# 创建一个AipOcr对象
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

# 读取图片文件
def get_file_content(file_path):
    with open(file_path, 'rb') as fp:
        return fp.read()

# 调用百度文字识别API进行文字识别
def recognize_text(image_path):
    # 读取图片文件
    image = get_file_content(image_path)

    # 调用百度文字识别API
    result = client.basicGeneral(image)

    # 解析识别结果
    if 'words_result' in result:
        for word_info in result['words_result']:
            print(word_info['words'])

# 测试代码
if __name__ == '__main__':
    image_path = 'test.png'  # 需要识别的图片文件路径
    recognize_text(image_path)

3. 코드 분석

  1. Baidu 텍스트 인식 API의 매개변수 구성

코드 시작 부분에 자체 APP_ID, API_KEY 및 SECRET_KEY를 입력해야 합니다. Baidu Cloud Console에 저장됩니다. 위 코드의 "your APP_ID", "your API_KEY" 및 "your SECRET_KEY"를 해당 값으로 바꿉니다.

  1. AipOcr 개체 만들기

이후 API 호출에 대해 APP_ID, API_KEY 및 SECRET_KEY를 전달하여 AipOcr 개체를 만듭니다.

  1. 이미지 파일 읽기

이미지 파일의 바이너리 콘텐츠를 읽으려면 get_file_content 함수를 작성하세요. Baidu 텍스트 인식 API를 호출할 때 이미지 파일을 바이너리 형식으로 변환해야 합니다. get_file_content,用于读取图片文件的二进制内容。在调用百度文字识别API时,需要将图片文件转化为二进制格式。

  1. 调用百度文字识别API进行文字识别

编写一个函数recognize_text,用于调用百度文字识别API进行文字识别。在函数内部,我们先读取图片文件的二进制内容,然后调用client.basicGeneral方法,传入图片内容进行文字识别。

  1. 解析识别结果

输出识别结果,遍历识别结果中的每个词块,将其中的文字信息打印出来。

四、测试运行

将需要识别的图片文件放在代码中指定的路径,替换变量image_path

    텍스트 인식을 위해 Baidu 텍스트 인식 API 호출

    텍스트 인식을 위해 Baidu 텍스트 인식 API를 호출하려면 recognize_text 함수를 작성하세요. 함수 내에서 먼저 이미지 파일의 바이너리 콘텐츠를 읽은 다음 client.basicGeneral 메서드를 호출하여 텍스트 인식을 위해 이미지 콘텐츠를 전달합니다.

      🎜인식 결과 분석🎜🎜🎜인식 결과를 출력하고, 인식 결과의 각 단어 블록을 순회하고, 텍스트 정보를 인쇄합니다. 🎜🎜4. 테스트 실행🎜🎜코드에 지정된 경로에 식별해야 하는 이미지 파일을 배치하고 image_path 변수의 값을 바꿉니다. 그런 다음 코드를 실행하면 콘솔의 그림에서 텍스트 정보를 볼 수 있습니다. 🎜🎜요약: 🎜🎜이 글에서는 Python 프로그래밍을 사용하여 Baidu Text Recognition API를 통해 사진 속 텍스트 인식을 구현하는 방법을 소개합니다. Baidu Cloud의 API Key와 Secret Key를 간단히 설정하면 텍스트 인식을 위해 이미지 파일을 API에 전달한 후 인식 결과를 구문 분석하여 텍스트 콘텐츠를 얻을 수 있습니다. Baidu Cloud에서 제공하는 Python SDK를 사용하면 개발자는 단 몇 줄의 코드만으로 텍스트 인식 기능을 빠르게 구현할 수 있습니다. 🎜

위 내용은 Python 프로그래밍은 Baidu 텍스트 인식 API 도킹 코드 공유를 구현합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.