ホームページ >バックエンド開発 >Python チュートリアル >Python プログラミングで Baidu テキスト認識 API ドッキング コード共有を実装
Python プログラミングは、Baidu Text Recognition API ドッキング コード共有を実装します。
はじめに: Baidu Text Recognition API は、テキストを抽出して編集可能なテキストに変換できる強力なテキスト認識ツールです。 。 Python プログラミングでは、Baidu テキスト認識 API ドッキング コードを使用してテキスト認識機能を実現できます。この記事では、テキスト認識に Baidu Text Recognition API を使用する方法を示す簡単な Python プログラムを紹介します。
1. 準備
Baidu Text Recognition API を使用する前に、Baidu Cloud アカウントを登録し、API を有効にする必要があります。サービス。
Baidu Cloud コンソールでテキスト認識アプリケーションを作成し、API キーとシークレット キーを取得します。各パラメータは API 呼び出しを行うための鍵となります。
ターミナルで次のコマンドを実行して、Python Baidu Cloud SDK をインストールします。
pip install baidu-aip
2. コードを記述します
以下は、テキスト認識に Baidu Text Recognition API を使用する方法を示す簡単な Python プログラムです:
from aip import AipOcr # 配置百度文字识别API的参数 APP_ID = '您的APP_ID' API_KEY = '您的API_KEY' SECRET_KEY = '您的SECRET_KEY' # 创建一个AipOcr对象 client = AipOcr(APP_ID, API_KEY, SECRET_KEY) # 读取图片文件 def get_file_content(file_path): with open(file_path, 'rb') as fp: return fp.read() # 调用百度文字识别API进行文字识别 def recognize_text(image_path): # 读取图片文件 image = get_file_content(image_path) # 调用百度文字识别API result = client.basicGeneral(image) # 解析识别结果 if 'words_result' in result: for word_info in result['words_result']: print(word_info['words']) # 测试代码 if __name__ == '__main__': image_path = 'test.png' # 需要识别的图片文件路径 recognize_text(image_path)
3. コード分析
コードの先頭で、独自の APP_ID、API_KEY、SECRET_KEY を入力する必要があります。これらのパラメータは Baidu Cloud Console に保存されています。上記のコードの「your APP_ID」、「your API_KEY」、および「your SECRET_KEY」を対応する値に置き換えます。
後続の API 呼び出しに APP_ID、API_KEY、および SECRET_KEY を渡して、AipOcr オブジェクトを作成します。
関数 get_file_content
を作成して、イメージ ファイルのバイナリ コンテンツを読み取ります。 Baidu テキスト認識 API を呼び出す場合、画像ファイルをバイナリ形式に変換する必要があります。
テキスト認識のために Baidu テキスト認識 API を呼び出すために使用される関数 recognize_text
を作成します。関数内では、まず画像ファイルのバイナリ コンテンツを読み取り、次に client.basicGeneral
メソッドを呼び出して、テキスト認識のために画像コンテンツを渡します。
認識結果を出力し、認識結果内の各単語ブロックをたどって、テキスト情報を出力します。
4. テスト実行
コードで指定されたパスに識別する画像ファイルを配置し、変数 image_path
の値を置き換えます。次に、コードを実行すると、コンソール上の画像にテキスト情報が表示されます。
概要:
この記事では、Python プログラミングを使用して、Baidu Text Recognition API を通じて画像内のテキスト認識を実現する方法を紹介します。 Baidu Cloud の API キーとシークレット キーを設定するだけで、画像ファイルをテキスト認識用の API に渡し、認識結果を解析してテキスト コンテンツを取得します。 Baidu Cloud が提供する Python SDK を使用すると、開発者はわずか数行のコードでテキスト認識機能を迅速に実装できます。
以上がPython プログラミングで Baidu テキスト認識 API ドッキング コード共有を実装の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。