Python を使用して Baidu AI インターフェイスに接続し、プログラムをより面白くしましょう
人工知能の発展に伴い、API (アプリケーション プログラム インターフェイス) はさまざまなものになりました。ソフトウェア開発者向けの標準ツール。 API はソフトウェアにさまざまな機能を提供し、プログラムをよりインテリジェントで興味深いものにします。 Baidu AI インターフェイスは現在、開発者の間で最も人気のあるインターフェイスの 1 つです。この記事では、Python を使用して Baidu AI インターフェイスに接続し、プログラムをより面白くする方法を紹介します。
まず、Baidu AI Open Platform (https://ai.baidu.com/) にアカウントを登録し、アプリケーションを作成する必要があります。作成が成功すると、Python プログラムで使用する API キーと秘密キーを取得します。
次に、Baidu AI のテキスト認識インターフェイスと音声合成インターフェイスを例として使用します。
テキスト認識インターフェイスは、画像からテキストを抽出でき、自動ドキュメント スキャンやライブラリ管理などのシナリオに適用できます。
まず、Baidu AI の Python SDK をインストールし、ターミナルで次のコマンドを入力する必要があります:
pip install baidu-aip
次に、関連するライブラリを Python プログラムにインポートします:
from aip import AipOcr
続行 次に、Baidu AI Open Platform から取得した API キー、秘密キー、およびアプリケーション ID を次のコードに入力します:
APP_ID = 'your app id' API_KEY = 'your api key' SECRET_KEY = 'your secret key' client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
ここで、上で作成したオブジェクトを使用して、画像内のテキストを識別できます。 。 「image.png」という名前の画像があるとします。テキスト認識には次のコードを使用できます。
def get_file_content(file_path): with open(file_path, 'rb') as fp: return fp.read() image = get_file_content("image.png") result = client.basicGeneral(image) for word in result['words_result']: print(word['words'])
上記のコードは、まず関数 get_file_content
を定義します。これは、Get を読み取るために使用されます。画像の内容。次に、画像コンテンツをテキスト認識インターフェイスの basicGeneral
メソッドに渡し、返された結果を調べて、認識されたテキストを出力します。
音声合成インターフェースは、テキストを音声に変換し、音色や話す速度を設定できます。読書ソフトウェアやスマート アシスタントなどのシナリオに適用できます。
同様に、Baidu AI の Python SDK をインストールし、関連するライブラリをインポートする必要があります:
from aip import AipSpeech
次に、Baidu AI オープン プラットフォームで取得した API キー、秘密キー、アプリケーション ID を入力します。次のコードを入力します。
APP_ID = 'your app id' API_KEY = 'your api key' SECRET_KEY = 'your secret key' client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
テキストの一部を音声に合成したいとします。次のコードを使用できます。
text = "欢迎来到百度AI开放平台" result = client.synthesis(text, 'zh', 1, { 'vol': 5, 'per': 4, }) if not isinstance(result, dict): with open('audio.mp3', 'wb') as f: f.write(result)
上記のコードは、「Baidu AI へようこそ」というテキストを渡します。 Open Platform」 音声合成インターフェースの 合成メソッドを指定し、言語を中国語、音量を 5、音色を Du Xiaoyao に設定します。次に、返された音声コンテンツをファイル「audio.mp3」に書き込みます。
Baidu AI インターフェースと接続することで、プログラムにさらに興味深い機能を持たせることができます。テキスト認識インターフェイスを使用すると、プログラムは画像内のテキスト情報を読み取ることができ、音声合成インターフェイスを使用すると、プログラムは音声を出力できます。 Baidu AI インターフェイスを使用すると、プログラムにさらに楽しさとインテリジェンスを追加できます。
以上がPython を使用して Baidu AI インターフェイスに接続し、プログラムをより興味深いものにしますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。