Python 프로그래밍을 사용하여 Baidu OCR 인터페이스 도킹을 구현하고 사진에서 텍스트를 추출하는 방법을 가르칩니다.
서문:
지속적인 기술 발전으로 인공 지능의 응용이 점점 더 널리 보급되고 있습니다. 그중에서도 이미지에서 텍스트를 추출하고 자동화된 처리를 달성하는 데 도움이 되는 텍스트 인식(OCR) 기술의 적용이 특히 중요합니다. Baidu OCR 인터페이스는 현재 매우 인기 있는 텍스트 인식 기술입니다. 이 기사에서는 Python 프로그래밍을 사용하여 Baidu OCR 인터페이스에 연결하여 사진에서 텍스트를 추출하는 방법을 설명합니다.
먼저 바이두 OCR 계정을 만들어야 합니다. 바이두 개발자 센터(https://cloud.baidu.com/)를 방문하여 계정을 등록하고 새 애플리케이션을 만드세요.
다음으로 텍스트 인식 작업을 용이하게 하기 위해 Baidu OCR 인터페이스와의 상호 작용 논리를 캡슐화하는 Baidu OCR Python SDK를 설치해야 합니다.
터미널 또는 명령 프롬프트를 열고 다음 명령을 실행하여 SDK를 설치하세요.
pip install baidu-aip
Python 파일에서 필요한 라이브러리를 가져오고 API 키를 설정하세요. API 키는 Baidu OCR 계정에서 생성한 애플리케이션이 소유한 키로, 신원을 인증하는 데 사용됩니다. 코드 예시는 다음과 같습니다.
from aip import AipOcr # 设置APPID/AK/SK APP_ID = 'your_app_id' API_KEY = 'your_api_key' SECRET_KEY = 'your_secret_key' # 创建AipOcr对象 client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
위 코드의 your_app_id
, your_api_key
, your_secret_key
를 Baidu에서 생성한 애플리케이션 이름으로 바꾸세요. OCR 계정 해당 API 키입니다. your_app_id
、your_api_key
、your_secret_key
替换成你在百度OCR账号中创建的应用所对应的API Key。
接下来,我们需要读取待识别的图片,并调用百度OCR接口,将图片中的文字提取出来。
def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read() # 读取图片 image = get_file_content('your_image_path') # 调用文字识别接口 result = client.basicGeneral(image) # 提取文字 words = [] for item in result['words_result']: words.append(item['words']) # 打印文字 for word in words: print(word)
将上述代码中的your_image_path
위 코드의 your_image_path
를 식별하려는 이미지의 경로로 바꾸세요.
위 단계를 완료한 후 Python 파일을 실행하고 테스트하여 이미지에서 추출된 텍스트를 확인할 수 있습니다.
요약:
🎜이 기사에서는 Python 프로그래밍을 사용하여 Baidu OCR 인터페이스 도킹을 구현하고 이미지에서 텍스트를 추출하는 단계를 소개합니다. 더 많은 텍스트 인식 기능을 달성하기 위해 필요에 따라 다른 Baidu OCR 인터페이스를 추가로 호출할 수 있습니다. 이 기사가 귀하에게 도움이 되기를 바라며 귀하의 프로젝트 개발에 도움이 되기를 바랍니다. 🎜🎜참조 링크: https://cloud.baidu.com/doc/OCR/index.html🎜🎜코드 샘플 링크: https://github.com/baidu-aip/python-sdk🎜위 내용은 Python 프로그래밍을 사용하여 Baidu OCR 인터페이스 도킹을 구현하고 사진에서 텍스트를 추출하는 방법을 가르칩니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!