Python 프로그래밍을 사용하여 Baidu 텍스트 인식 API의 도킹 방법 구현
인공지능의 발전과 함께 텍스트 인식 기술이 널리 사용되었습니다. Baidu는 프로그래밍을 통해 텍스트 인식, 추출 및 분석을 실현할 수 있는 텍스트 인식 API 세트를 제공하여 개발자를 크게 촉진합니다. 이 기사에서는 Python을 사용하여 코드를 작성하고, Baidu 텍스트 인식 API에 연결하고, 독자의 참조를 위한 코드 예제를 제공하는 방법을 소개합니다.
Baidu Text Recognition API를 사용하기 전에 Baidu Cloud Platform 계정을 등록하고 새 애플리케이션을 만들어야 합니다. 그런 다음 API 사용에 필요한 정보인 API Key와 Secret Key를 획득합니다.
또한 pip 명령을 통해 설치할 수 있는 Python용 Baidu AI SDK를 설치해야 합니다.
pip install baidu-aip
먼저 Python 프로그램에서 baidu-aip 모듈을 가져와야 합니다. 그런 다음 AipOcr의 인스턴스 개체를 만들고 이 개체를 통해 API를 호출합니다.
from aip import AipOcr # 请替换为自己的API Key和Secret Key APP_ID = '您的APP_ID' API_KEY = '您的API_KEY' SECRET_KEY = '您的SECRET_KEY' client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
다음으로 이미지 파일을 읽고 인식을 위해 텍스트 인식 API를 호출하는 함수를 정의할 수 있습니다.
def get_text_from_image(image_path): with open(image_path, 'rb') as fp: image = fp.read() result = client.basicGeneral(image) # 解析识别结果 text_list = [] if 'words_result' in result: for item in result['words_result']: text_list.append(item['words']) return text_list
위 코드에서는 client.basicGeneral(image)
方法调用文字识别API。该方法接受一个图片的二进制数据作为参数,并返回识别结果。通过遍历结果中的words_result
필드를 사용하여 각 줄의 인식된 텍스트를 얻을 수 있습니다.
마지막으로 텍스트 인식 기능을 테스트하고 사진을 입력하여 인식 결과를 인쇄할 수 있습니다.
if __name__ == '__main__': image_path = 'test.jpg' result_text = get_text_from_image(image_path) for text in result_text: print(text)
이 글에서는 Python 프로그래밍을 사용하여 Baidu 텍스트 인식 API의 도킹 방법을 구현하는 방법을 소개하고 전체 코드 예제를 제공합니다. Baidu Text Recognition API에 연결하면 이미지에서 텍스트를 쉽게 인식하고 추출할 수 있어 텍스트 분석 및 처리가 용이해집니다. 이 글이 독자들에게 도움이 되기를 바라며, 독자들이 실제 프로젝트에서 Baidu 텍스트 인식 API의 장점을 마음껏 발휘할 수 있기를 바랍니다.
위 내용은 Python 프로그래밍을 사용하여 Baidu 텍스트 인식 API의 도킹 방법 구현의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!