집 >백엔드 개발 >파이썬 튜토리얼 >Python은 Baidu 음성 인식 API를 구현합니다.

Python은 Baidu 음성 인식 API를 구현합니다.

不言원래의: 2018-04-10 15:19:293657검색

이 글은 주로 Baidu 음성 인식 API를 구현하기 위한 Python을 자세하게 소개하고 있으며, 참고할만한 가치가 있습니다. 도움이 필요한 친구들이 참고할 수 있습니다.

이 글의 예시는 Baidu 음성 인식 API를 구현하기 위한 구체적인 Python 코드를 공유합니다. , 구체적인 내용은 다음과 같습니다

자세한 Baidu 음성 인식 API 문서

먼저 Python SDK를 다운로드하고 python setup.py install로 설치하면 됩니다

# 引入Speech SDK
from aip import AipSpeech

# 定义常量
APP_ID = &#39;你的 App ID&#39;
API_KEY = &#39;你的 API Key&#39;
SECRET_KEY = &#39;你的 Secret Key&#39;

# 初始化AipSpeech对象
aipSpeech = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

위 코드에서 상수 APP_ID는 다음과 같습니다. Baidu Cloud Console에서 생성된 상수 API_KEY 및 SECRET_KEY는 애플리케이션이 생성된 후 시스템에서 사용자에게 할당되며, 둘 다 사용자를 식별하고 액세스를 위한 서명 확인을 수행하는 데 사용되는 문자열입니다. AI 서비스 콘솔에서.

인식 시작

참고:

요청 지침:
1 현재 원본 음성의 녹음 형식은 8k/16k 샘플링 속도 16비트 비트 깊이 모노 음성 평가만 지원합니다.
2. 압축 형식 지원: pcm(비압축), wav, amr
3. 시스템은 중국어(zh), 광둥어(ct), 영어(en)를 지원합니다.

# 读取文件
def get_file_content(filePath):
  with open(filePath, &#39;rb&#39;) as fp:
    return fp.read()

# 识别本地文件
aipSpeech.asr(get_file_content(&#39;audio.pcm&#39;), &#39;pcm&#39;, 16000, {
  &#39;lan&#39;: &#39;zh&#39;,
})

# 从URL获取文件识别
aipSpeech.asr(&#39;&#39;, &#39;pcm&#39;, 16000, {
  &#39;url&#39;: &#39;http://121.40.195.233/res/16k_test.pcm&#39;,
  &#39;callback&#39;: &#39;http://xxx.com/receive&#39;,
})

반환 결과:

// 成功返回
{
  "err_no": 0,
  "err_msg": "success.",
  "corpus_no": "15984125203285346378",
  "sn": "481D633F-73BA-726F-49EF-8659ACCC2F3D",
  "result": ["北京天气"]
}

// 失败返回
{
  "err_no": 2000,
  "err_msg": "data empty.",
  "sn": null
}

Python은 Baidu 음성 인식 API를 구현합니다.

관련 기사