Python プログラミングを使用して Baidu テキスト認識 API のドッキング メソッドを実装する
人工知能の発展とともに, テキスト認識技術は広く使用されています。 Baidu は、プログラミングを通じてテキストの認識、抽出、分析を実現できる一連のテキスト認識 API を提供しており、開発が大幅に容易になります。この記事では、Python を使用してコードを記述し、Baidu テキスト認識 API に接続する方法を紹介し、読者の参考となるコード例を提供します。
Baidu テキスト認識 API を使用する前に、Baidu Cloud Platform アカウントを登録し、新しいアプリケーションを作成する必要があります。次に、APIを利用するために必要な情報であるAPI KeyとSecret Keyを取得します。
さらに、Baidu AI SDK for Python をインストールする必要があります。これは pip コマンドでインストールできます:
pip install baidu-aip
まず、baidu-aip モジュールを Python プログラムにインポートし、次に AipOcr のインスタンス オブジェクトを作成し、このオブジェクトを通じて API を呼び出す必要があります。
from aip import AipOcr # 请替换为自己的API Key和Secret Key APP_ID = '您的APP_ID' API_KEY = '您的API_KEY' SECRET_KEY = '您的SECRET_KEY' client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
次に、画像ファイルを読み取り、認識のためにテキスト認識 API を呼び出す関数を定義できます。
def get_text_from_image(image_path): with open(image_path, 'rb') as fp: image = fp.read() result = client.basicGeneral(image) # 解析识别结果 text_list = [] if 'words_result' in result: for item in result['words_result']: text_list.append(item['words']) return text_list
上記のコードでは、client.basicGeneral(image)
メソッドを使用してテキスト認識 API を呼び出します。このメソッドは画像のバイナリデータをパラメータとして受け取り、認識結果を返します。結果の words_result
フィールドをトラバースすることで、各行の認識されたテキストを取得できます。
最後に、テキスト認識機能をテストし、入力として写真を撮り、認識結果を印刷できます。
if __name__ == '__main__': image_path = 'test.jpg' result_text = get_text_from_image(image_path) for text in result_text: print(text)
この記事では、Python プログラミングを使用して Baidu テキスト認識 API のドッキング メソッドを実装する方法を紹介し、完全なコード例を示します。 Baidu Text Recognition API に接続すると、画像からテキストを簡単に認識して抽出できるため、テキストの分析と処理が容易になります。この記事が読者の役に立ち、読者が実際のプロジェクトで Baidu テキスト認識 API の利点を最大限に活用できることを願っています。
以上がPython プログラミングを使用して Baidu テキスト認識 API のドッキング メソッドを実装するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。