教你使用Python程式實現百度OCR介面對接,提取圖片中的文字
前言:
隨著技術的不斷發展,人工智能的應用越來越廣泛。其中,文字辨識(OCR)技術的應用尤其重要,可以幫助我們從圖片中提取文字,實現自動化處理。百度OCR介面是目前非常流行的一個文字辨識技術,本文將教你使用Python程式對接百度OCR接口,實作擷取圖片中的文字。
首先,你需要建立一個百度OCR帳號。造訪百度開發者中心(https://cloud.baidu.com/),註冊帳號並建立一個新的應用程式。
接下來,我們需要安裝百度OCR Python SDK,該SDK封裝了與百度OCR介面的互動邏輯,方便我們進行文字識別的操作。
開啟終端機或指令提示符,執行以下指令安裝SDK:
pip install baidu-aip
在你的Python文件中,導入必要的庫和設定API Key。 API Key是你在百度OCR帳號中所建立的應用程式所具有的金鑰,用來鑑權身分。程式碼範例如下:
from aip import AipOcr # 设置APPID/AK/SK APP_ID = 'your_app_id' API_KEY = 'your_api_key' SECRET_KEY = 'your_secret_key' # 创建AipOcr对象 client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
將上述程式碼中的your_app_id
、your_api_key
、your_secret_key
##取代你在百度OCR帳號中建立的應用所對應的API Key。
接下來,我們需要讀取待識別的圖片,並呼叫百度OCR接口,將圖片中的文字提取出來。
def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read() # 读取图片 image = get_file_content('your_image_path') # 调用文字识别接口 result = client.basicGeneral(image) # 提取文字 words = [] for item in result['words_result']: words.append(item['words']) # 打印文字 for word in words: print(word)
將上述程式碼中的your_image_path
替換成你待辨識的圖片路徑。
完成以上步驟後,你可以執行Python檔案並進行測試,檢視圖片中擷取出來的文字。
總結:
本文透過介紹了使用Python程式實作百度OCR介面對接,擷取圖片中的文字的步驟。你可以根據自己的需求,進一步呼叫其他百度OCR接口,實現更多的文字辨識功能。希望這篇文章能幫助你,為你的專案開發提供一些幫助。
參考連結:https://cloud.baidu.com/doc/OCR/index.html
程式碼範例連結:https://github.com/baidu-aip/python- sdk
以上是教你使用Python程式實現百度OCR介面對接,擷取圖片中的文字的詳細內容。更多資訊請關注PHP中文網其他相關文章!