ホームページ  >  記事  >  バックエンド開発  >  Baidu音声認識APIをPythonで実装する方法の詳細な説明

Baidu音声認識APIをPythonで実装する方法の詳細な説明

php中世界最好的语言
php中世界最好的语言オリジナル
2018-04-12 09:51:342259ブラウズ

今回は、Baidu 音声認識 API を実装するための Python の手順について詳しく説明します。Baidu 音声認識 API を実装するための Python の notes とは何ですか。実際の事例を見てみましょう。

この記事の例では、参考のために Baidu 音声認識を実装するための Python の特定のコードを共有します。具体的な内容は次のとおりです

Baidu 音声認識 API ドキュメントの詳細

まず Python SDK をダウンロードし、Python セットアップを使用できます。 py install

install

# 引入Speech SDK
from aip import AipSpeech
# 定义常量
APP_ID = '你的 App ID'
API_KEY = '你的 API Key'
SECRET_KEY = '你的 Secret Key'
# 初始化AipSpeech对象
aipSpeech = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
上記のコードでは、定数 APP_ID が Baidu Cloud コンソールで作成されます。定数 API_KEY と SECRET_KEY は、両方とも

文字列 です。ユーザーを識別し、アクセスに署名するために使用されます。検証は、AI サービス コンソールのアプリケーション リストで確認できます。

認識を開始します

注意:

指示のリクエスト:

1. 現在、オリジナルの音声の録音形式は、評価用に 8k/16k サンプリング レートと 16 ビットのビット深度のモノラル音声のみをサポートしています
2。サポートされる圧縮形式: pcm (非圧縮)、wav、amr
3. システムは言語タイプをサポートします: 中国語 (zh)、広東語 (ct)、英語 (en)。

# 读取文件
def get_file_content(filePath):
  with open(filePath, 'rb') as fp:
    return fp.read()
# 识别本地文件
aipSpeech.asr(get_file_content('audio.pcm'), 'pcm', 16000, {
  'lan': 'zh',
})
# 从URL获取文件识别
aipSpeech.asr('', 'pcm', 16000, {
  'url': 'http://121.40.195.233/res/16k_test.pcm',
  'callback': 'http://xxx.com/receive',
})
戻り結果:

// 成功返回
{
  "err_no": 0,
  "err_msg": "success.",
  "corpus_no": "15984125203285346378",
  "sn": "481D633F-73BA-726F-49EF-8659ACCC2F3D",
  "result": ["北京天气"]
}
// 失败返回
{
  "err_no": 2000,
  "err_msg": "data empty.",
  "sn": null
}
この記事の事例を読んだ後は、この方法を習得したと思います。さらに興味深い情報については、php 中国語 Web サイトの他の関連記事に注目してください。

推奨読書:

スマート リプライ機能を実装するために Python が API を呼び出す方法

Python がデータフレームの時間フィールドを処理する方法

Python がテキスト データを読み取って DataFrame 形式に変換する方法の詳細な説明

以上がBaidu音声認識APIをPythonで実装する方法の詳細な説明の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。