Maison  >  Article  >  développement back-end  >  Explication détaillée de la façon d'implémenter l'API de reconnaissance vocale Baidu en python

Explication détaillée de la façon d'implémenter l'API de reconnaissance vocale Baidu en python

php中世界最好的语言
php中世界最好的语言original
2018-04-12 09:51:342248parcourir

Cette fois, je vais vous apporter une explication détaillée des étapes de python sur la façon de mettre en œuvre l'API de reconnaissance vocale Baidu Quelles sont les précautions pour la mise en œuvre de l'API de reconnaissance vocale Baidu. en python Ce qui suit est un cas pratique.

L'exemple de cet article partage le code spécifique de Python pour implémenter la reconnaissance vocale Baidu pour votre référence. Le contenu spécifique est le suivant

Document détaillé de l'API de reconnaissance vocale Baidu

Télécharger python first Le SDK peut être installé avec python setup.py install

# 引入Speech SDK
from aip import AipSpeech
# 定义常量
APP_ID = '你的 App ID'
API_KEY = '你的 API Key'
SECRET_KEY = '你的 Secret Key'
# 初始化AipSpeech对象
aipSpeech = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

Dans le code ci-dessus, la constante APP_ID est créée dans la console Baidu Cloud, et les constantes API_KEY et SECRET_KEY sont après la création de l'application. Toutes les chaînes attribuées aux utilisateurs par le système sont des chaînes , qui sont utilisées pour identifier les utilisateurs et effectuer une vérification de signature pour l'accès. Elles peuvent être consultées dans la liste des applications dans l'IA. console de service.

Démarrer la reconnaissance

Remarque :

Demande d'instructions :
1. Le format d'enregistrement ne prend actuellement en charge que la voix monophonique avec un taux d'échantillonnage de 8k/16k et une profondeur de bits de 16 bits
2. Formats de compression pris en charge : pcm (non compressé), wav, amr
Langues prises en charge par le système : chinois (zh), cantonais. (ct), anglais (en).

# 读取文件
def get_file_content(filePath):
  with open(filePath, 'rb') as fp:
    return fp.read()
# 识别本地文件
aipSpeech.asr(get_file_content('audio.pcm'), 'pcm', 16000, {
  'lan': 'zh',
})
# 从URL获取文件识别
aipSpeech.asr('', 'pcm', 16000, {
  'url': 'http://121.40.195.233/res/16k_test.pcm',
  'callback': 'http://xxx.com/receive',
})

Résultats renvoyés :

// 成功返回
{
  "err_no": 0,
  "err_msg": "success.",
  "corpus_no": "15984125203285346378",
  "sn": "481D633F-73BA-726F-49EF-8659ACCC2F3D",
  "result": ["北京天气"]
}
// 失败返回
{
  "err_no": 2000,
  "err_msg": "data empty.",
  "sn": null
}

Je pense que vous maîtrisez la méthode après avoir lu le cas dans cet article. Pour des informations plus intéressantes, veuillez prêter attention aux autres articles connexes sur le. php site chinois !

Lecture recommandée :

Comment Python appelle l'API pour implémenter la fonction de réponse intelligente

Comment Python gère le champ temporel du dataframe

Explication détaillée de la façon dont Python lit les données texte et les convertit au format DataFrame

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn