ホームページ  >  記事  >  バックエンド開発  >  Python プログラミングで Baidu テキスト認識 API ドッキング コード共有を実装

Python プログラミングで Baidu テキスト認識 API ドッキング コード共有を実装

王林
王林オリジナル
2023-08-25 13:57:071362ブラウズ

Python プログラミングで Baidu テキスト認識 API ドッキング コード共有を実装

Python プログラミングは、Baidu Text Recognition API ドッキング コード共有を実装します。

はじめに: Baidu Text Recognition API は、テキストを抽出して編集可能なテキストに変換できる強力なテキスト認識ツールです。 。 Python プログラミングでは、Baidu テキスト認識 API ドッキング コードを使用してテキスト認識機能を実現できます。この記事では、テキスト認識に Baidu Text Recognition API を使用する方法を示す簡単な Python プログラムを紹介します。

1. 準備

  1. Baidu Cloud アカウントの登録

Baidu Text Recognition API を使用する前に、Baidu Cloud アカウントを登録し、API を有効にする必要があります。サービス。

  1. テキスト認識アプリケーションを作成し、API キーとシークレット キーを取得します。

Baidu Cloud コンソールでテキスト認識アプリケーションを作成し、API キーとシークレット キーを取得します。各パラメータは API 呼び出しを行うための鍵となります。

  1. Python Baidu Cloud SDK のインストール

ターミナルで次のコマンドを実行して、Python Baidu Cloud SDK をインストールします。

pip install baidu-aip

2. コードを記述します

以下は、テキスト認識に Baidu Text Recognition API を使用する方法を示す簡単な Python プログラムです:

from aip import AipOcr

# 配置百度文字识别API的参数
APP_ID = '您的APP_ID'
API_KEY = '您的API_KEY'
SECRET_KEY = '您的SECRET_KEY'

# 创建一个AipOcr对象
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

# 读取图片文件
def get_file_content(file_path):
    with open(file_path, 'rb') as fp:
        return fp.read()

# 调用百度文字识别API进行文字识别
def recognize_text(image_path):
    # 读取图片文件
    image = get_file_content(image_path)

    # 调用百度文字识别API
    result = client.basicGeneral(image)

    # 解析识别结果
    if 'words_result' in result:
        for word_info in result['words_result']:
            print(word_info['words'])

# 测试代码
if __name__ == '__main__':
    image_path = 'test.png'  # 需要识别的图片文件路径
    recognize_text(image_path)

3. コード分析

  1. Baidu Text のパラメーターの構成認識 API

コードの先頭で、独自の APP_ID、API_KEY、SECRET_KEY を入力する必要があります。これらのパラメータは Baidu Cloud Console に保存されています。上記のコードの「your APP_ID」、「your API_KEY」、および「your SECRET_KEY」を対応する値に置き換えます。

  1. AipOcr オブジェクトの作成

後続の API 呼び出しに APP_ID、API_KEY、および SECRET_KEY を渡して、AipOcr オブジェクトを作成します。

  1. イメージ ファイルの読み取り

関数 get_file_content を作成して、イメージ ファイルのバイナリ コンテンツを読み取ります。 Baidu テキスト認識 API を呼び出す場合、画像ファイルをバイナリ形式に変換する必要があります。

  1. テキスト認識のために Baidu テキスト認識 API を呼び出す

テキスト認識のために Baidu テキスト認識 API を呼び出すために使用される関数 recognize_text を作成します。関数内では、まず画像ファイルのバイナリ コンテンツを読み取り、次に client.basicGeneral メソッドを呼び出して、テキスト認識のために画像コンテンツを渡します。

  1. 認識結果を分析する

認識結果を出力し、認識結果内の各単語ブロックをたどって、テキスト情報を出力します。

4. テスト実行

コードで指定されたパスに識別する画像ファイルを配置し、変数 image_path の値を置き換えます。次に、コードを実行すると、コンソール上の画像にテキスト情報が表示されます。

概要:

この記事では、Python プログラミングを使用して、Baidu Text Recognition API を通じて画像内のテキスト認識を実現する方法を紹介します。 Baidu Cloud の API キーとシークレット キーを設定するだけで、画像ファイルをテキスト認識用の API に渡し、認識結果を解析してテキスト コンテンツを取得します。 Baidu Cloud が提供する Python SDK を使用すると、開発者はわずか数行のコードでテキスト認識機能を迅速に実装できます。

以上がPython プログラミングで Baidu テキスト認識 API ドッキング コード共有を実装の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。