この記事では主に Baidu 音声認識 API を実装するための Python を詳しく紹介します。必要な友人は参考にしてください。
この記事の例では、Baidu 音声認識を実装するための Python のコードを共有します。 、具体的な内容は次のとおりです
Baidu 音声認識 API の詳細なドキュメント
まず Python SDK をダウンロードし、python setup.py install でインストールできます
# 引入Speech SDK from aip import AipSpeech # 定义常量 APP_ID = '你的 App ID' API_KEY = '你的 API Key' SECRET_KEY = '你的 Secret Key' # 初始化AipSpeech对象 aipSpeech = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
上記のコードでは、定数 APP_ID はBaidu Cloud Console で作成される定数 API_KEY と SECRET_KEY は、アプリケーションの作成後にシステムによってユーザーに割り当てられます。これらはどちらもユーザーを識別し、アクセスのための署名検証を実行するために使用される文字列です。 AIサービスコンソールで。
認識を開始します
注:
リクエストの手順:
1. 現在、オリジナルの音声の録音形式は、8k/16k サンプリング レート、16 ビットのビット深度のモノラル音声の評価のみをサポートしています
2。サポートする圧縮形式: pcm (非圧縮)、wav、amr
3. システムがサポートする言語タイプ: 中国語 (zh)、広東語 (ct)、英語 (en)。
# 读取文件 def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read() # 识别本地文件 aipSpeech.asr(get_file_content('audio.pcm'), 'pcm', 16000, { 'lan': 'zh', }) # 从URL获取文件识别 aipSpeech.asr('', 'pcm', 16000, { 'url': 'http://121.40.195.233/res/16k_test.pcm', 'callback': 'http://xxx.com/receive', })
戻り結果:
// 成功返回 { "err_no": 0, "err_msg": "success.", "corpus_no": "15984125203285346378", "sn": "481D633F-73BA-726F-49EF-8659ACCC2F3D", "result": ["北京天气"] } // 失败返回 { "err_no": 2000, "err_msg": "data empty.", "sn": null }
関連推奨事項:
Pythonを使用してWebユーザーのログインおよび登録機能を実装します
Pythonは配列リストの追加、削除、および変更を実装します
以上がPython が Baidu 音声認識 API を実装の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。