ホームページ >バックエンド開発 >Python チュートリアル >Python プログラミングを使用して Baidu テキスト認識 API のドッキング メソッドを実装する
Python プログラミングを使用して Baidu テキスト認識 API のドッキング メソッドを実装する
人工知能の発展とともに, テキスト認識技術は広く使用されています。 Baidu は、プログラミングを通じてテキストの認識、抽出、分析を実現できる一連のテキスト認識 API を提供しており、開発が大幅に容易になります。この記事では、Python を使用してコードを記述し、Baidu テキスト認識 API に接続する方法を紹介し、読者の参考となるコード例を提供します。
Baidu テキスト認識 API を使用する前に、Baidu Cloud Platform アカウントを登録し、新しいアプリケーションを作成する必要があります。次に、APIを利用するために必要な情報であるAPI KeyとSecret Keyを取得します。
さらに、Baidu AI SDK for Python をインストールする必要があります。これは pip コマンドでインストールできます:
pip install baidu-aip
まず、baidu-aip モジュールを Python プログラムにインポートし、次に AipOcr のインスタンス オブジェクトを作成し、このオブジェクトを通じて API を呼び出す必要があります。
from aip import AipOcr # 请替换为自己的API Key和Secret Key APP_ID = '您的APP_ID' API_KEY = '您的API_KEY' SECRET_KEY = '您的SECRET_KEY' client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
次に、画像ファイルを読み取り、認識のためにテキスト認識 API を呼び出す関数を定義できます。
def get_text_from_image(image_path): with open(image_path, 'rb') as fp: image = fp.read() result = client.basicGeneral(image) # 解析识别结果 text_list = [] if 'words_result' in result: for item in result['words_result']: text_list.append(item['words']) return text_list
上記のコードでは、client.basicGeneral(image)
メソッドを使用してテキスト認識 API を呼び出します。このメソッドは画像のバイナリデータをパラメータとして受け取り、認識結果を返します。結果の words_result
フィールドをトラバースすることで、各行の認識されたテキストを取得できます。
最後に、テキスト認識機能をテストし、入力として写真を撮り、認識結果を印刷できます。
if __name__ == '__main__': image_path = 'test.jpg' result_text = get_text_from_image(image_path) for text in result_text: print(text)
この記事では、Python プログラミングを使用して Baidu テキスト認識 API のドッキング メソッドを実装する方法を紹介し、完全なコード例を示します。 Baidu Text Recognition API に接続すると、画像からテキストを簡単に認識して抽出できるため、テキストの分析と処理が容易になります。この記事が読者の役に立ち、読者が実際のプロジェクトで Baidu テキスト認識 API の利点を最大限に活用できることを願っています。
以上がPython プログラミングを使用して Baidu テキスト認識 API のドッキング メソッドを実装するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。