>  기사  >  백엔드 개발  >  Python은 Baidu 음성 인식 API를 구현합니다.

Python은 Baidu 음성 인식 API를 구현합니다.

不言
不言원래의
2018-04-10 15:19:293446검색

이 글은 주로 Baidu 음성 인식 API를 구현하기 위한 Python을 자세하게 소개하고 있으며, 참고할만한 가치가 있습니다. 도움이 필요한 친구들이 참고할 수 있습니다.

이 글의 예시는 Baidu 음성 인식 API를 구현하기 위한 구체적인 Python 코드를 공유합니다. , 구체적인 내용은 다음과 같습니다

자세한 Baidu 음성 인식 API 문서

먼저 Python SDK를 다운로드하고 python setup.py install로 설치하면 됩니다

# 引入Speech SDK
from aip import AipSpeech

# 定义常量
APP_ID = '你的 App ID'
API_KEY = '你的 API Key'
SECRET_KEY = '你的 Secret Key'

# 初始化AipSpeech对象
aipSpeech = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

위 코드에서 상수 APP_ID는 다음과 같습니다. Baidu Cloud Console에서 생성된 상수 API_KEY 및 SECRET_KEY는 애플리케이션이 생성된 후 시스템에서 사용자에게 할당되며, 둘 다 사용자를 식별하고 액세스를 위한 서명 확인을 수행하는 데 사용되는 문자열입니다. AI 서비스 콘솔에서.

인식 시작

참고:

요청 지침:
1 현재 원본 음성의 녹음 형식은 8k/16k 샘플링 속도 16비트 비트 깊이 모노 음성 평가만 지원합니다.
2. 압축 형식 지원: pcm(비압축), wav, amr
3. 시스템은 중국어(zh), 광둥어(ct), 영어(en)를 지원합니다.

# 读取文件
def get_file_content(filePath):
  with open(filePath, 'rb') as fp:
    return fp.read()

# 识别本地文件
aipSpeech.asr(get_file_content('audio.pcm'), 'pcm', 16000, {
  'lan': 'zh',
})

# 从URL获取文件识别
aipSpeech.asr('', 'pcm', 16000, {
  'url': 'http://121.40.195.233/res/16k_test.pcm',
  'callback': 'http://xxx.com/receive',
})

반환 결과:

// 成功返回
{
  "err_no": 0,
  "err_msg": "success.",
  "corpus_no": "15984125203285346378",
  "sn": "481D633F-73BA-726F-49EF-8659ACCC2F3D",
  "result": ["北京天气"]
}

// 失败返回
{
  "err_no": 2000,
  "err_msg": "data empty.",
  "sn": null
}

관련 권장 사항:

Python을 사용하여 웹 사용자 로그인 및 등록 기능 구현

Python은 배열 목록의 추가, 삭제 및 수정을 구현합니다

위 내용은 Python은 Baidu 음성 인식 API를 구현합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.