ホームページ  >  記事  >  バックエンド開発  >  Python を使用して Baidu AI インターフェイスに接続し、プログラムをより興味深いものにします

Python を使用して Baidu AI インターフェイスに接続し、プログラムをより興味深いものにします

WBOY
WBOYオリジナル
2023-08-12 08:27:251531ブラウズ

Python を使用して Baidu AI インターフェイスに接続し、プログラムをより興味深いものにします

Python を使用して Baidu AI インターフェイスに接続し、プログラムをより面白くしましょう

人工知能の発展に伴い、API (アプリケーション プログラム インターフェイス) はさまざまなものになりました。ソフトウェア開発者向けの標準ツール。 API はソフトウェアにさまざまな機能を提供し、プログラムをよりインテリジェントで興味深いものにします。 Baidu AI インターフェイスは現在、開発者の間で最も人気のあるインターフェイスの 1 つです。この記事では、Python を使用して Baidu AI インターフェイスに接続し、プログラムをより面白くする方法を紹介します。

まず、Baidu AI Open Platform (https://ai.baidu.com/) にアカウントを登録し、アプリケーションを作成する必要があります。作成が成功すると、Python プログラムで使用する API キーと秘密キーを取得します。

次に、Baidu AI のテキスト認識インターフェイスと音声合成インターフェイスを例として使用します。

  1. テキスト認識インターフェイス

テキスト認識インターフェイスは、画像からテキストを抽出でき、自動ドキュメント スキャンやライブラリ管理などのシナリオに適用できます。

まず、Baidu AI の Python SDK をインストールし、ターミナルで次のコマンドを入力する必要があります:

pip install baidu-aip

次に、関連するライブラリを Python プログラムにインポートします:

from aip import AipOcr

続行 次に、Baidu AI Open Platform から取得した API キー、秘密キー、およびアプリケーション ID を次のコードに入力します:

APP_ID = 'your app id'
API_KEY = 'your api key'
SECRET_KEY = 'your secret key'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

ここで、上で作成したオブジェクトを使用して、画像内のテキストを識別できます。 。 「image.png」という名前の画像があるとします。テキスト認識には次のコードを使用できます。

def get_file_content(file_path):
    with open(file_path, 'rb') as fp:
        return fp.read()

image = get_file_content("image.png")

result = client.basicGeneral(image)
for word in result['words_result']:
    print(word['words'])

上記のコードは、まず関数 get_file_content を定義します。これは、Get を読み取るために使用されます。画像の内容。次に、画像コンテンツをテキスト認識インターフェイスの basicGeneral メソッドに渡し、返された結果を調べて、認識されたテキストを出力します。

  1. 音声合成インターフェース

音声合成インターフェースは、テキストを音声に変換し、音色や話す速度を設定できます。読書ソフトウェアやスマート アシスタントなどのシナリオに適用できます。

同様に、Baidu AI の Python SDK をインストールし、関連するライブラリをインポートする必要があります:

from aip import AipSpeech

次に、Baidu AI オープン プラットフォームで取得した API キー、秘密キー、アプリケーション ID を入力します。次のコードを入力します。

APP_ID = 'your app id'
API_KEY = 'your api key'
SECRET_KEY = 'your secret key'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

テキストの一部を音声に合成したいとします。次のコードを使用できます。

text = "欢迎来到百度AI开放平台"

result = client.synthesis(text, 'zh', 1, {
    'vol': 5,
    'per': 4,
})

if not isinstance(result, dict):
    with open('audio.mp3', 'wb') as f:
        f.write(result)

上記のコードは、「Baidu AI へようこそ」というテキストを渡します。 Open Platform」 音声合成インターフェースの 合成メソッドを指定し、言語を中国語、音量を 5、音色を Du Xiaoyao に設定します。次に、返された音声コンテンツをファイル「audio.mp3」に書き込みます。

Baidu AI インターフェースと接続することで、プログラムにさらに興味深い機能を持たせることができます。テキスト認識インターフェイスを使用すると、プログラムは画像内のテキスト情報を読み取ることができ、音声合成インターフェイスを使用すると、プログラムは音声を出力できます。 Baidu AI インターフェイスを使用すると、プログラムにさらに楽しさとインテリジェンスを追加できます。

以上がPython を使用して Baidu AI インターフェイスに接続し、プログラムをより興味深いものにしますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。