ホームページ >バックエンド開発 >Python チュートリアル >Python が Baidu 音声認識 API を実装

Python が Baidu 音声認識 API を実装

不言オリジナル: 2018-04-10 15:19:293597ブラウズ

この記事では主に Baidu 音声認識 API を実装するための Python を詳しく紹介します。必要な友人は参考にしてください。

この記事の例では、Baidu 音声認識を実装するための Python のコードを共有します。、具体的な内容は次のとおりです

Baidu 音声認識 API の詳細なドキュメント

まず Python SDK をダウンロードし、python setup.py install でインストールできます

# 引入Speech SDK
from aip import AipSpeech

# 定义常量
APP_ID = &#39;你的 App ID&#39;
API_KEY = &#39;你的 API Key&#39;
SECRET_KEY = &#39;你的 Secret Key&#39;

# 初始化AipSpeech对象
aipSpeech = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

上記のコードでは、定数 APP_ID はBaidu Cloud Console で作成される定数 API_KEY と SECRET_KEY は、アプリケーションの作成後にシステムによってユーザーに割り当てられます。これらはどちらもユーザーを識別し、アクセスのための署名検証を実行するために使用される文字列です。 AIサービスコンソールで。

認識を開始します

注:

リクエストの手順:
1. 現在、オリジナルの音声の録音形式は、8k/16k サンプリングレート、16 ビットのビット深度のモノラル音声の評価のみをサポートしています
2。サポートする圧縮形式: pcm (非圧縮)、wav、amr
3. システムがサポートする言語タイプ: 中国語 (zh)、広東語 (ct)、英語 (en)。

# 读取文件
def get_file_content(filePath):
  with open(filePath, &#39;rb&#39;) as fp:
    return fp.read()

# 识别本地文件
aipSpeech.asr(get_file_content(&#39;audio.pcm&#39;), &#39;pcm&#39;, 16000, {
  &#39;lan&#39;: &#39;zh&#39;,
})

# 从URL获取文件识别
aipSpeech.asr(&#39;&#39;, &#39;pcm&#39;, 16000, {
  &#39;url&#39;: &#39;http://121.40.195.233/res/16k_test.pcm&#39;,
  &#39;callback&#39;: &#39;http://xxx.com/receive&#39;,
})

戻り結果:

// 成功返回
{
  "err_no": 0,
  "err_msg": "success.",
  "corpus_no": "15984125203285346378",
  "sn": "481D633F-73BA-726F-49EF-8659ACCC2F3D",
  "result": ["北京天气"]
}

// 失败返回
{
  "err_no": 2000,
  "err_msg": "data empty.",
  "sn": null
}

Python が Baidu 音声認識 API を実装

関連記事