>  기사  >  백엔드 개발  >  Python에서 Baidu 음성 인식 API를 구현하는 방법에 대한 자세한 설명

Python에서 Baidu 음성 인식 API를 구현하는 방법에 대한 자세한 설명

php中世界最好的语言
php中世界最好的语言원래의
2018-04-12 09:51:342260검색

이번에는 Baidu 음성 인식 API를 구현하는 python 단계에 대해 자세히 설명하겠습니다. Baidu 음성 인식 API를 구현하기 위한 Python의 노트는 무엇인지 살펴보겠습니다.

이 글의 예시는 참고용으로 Baidu 음성 인식을 구현하기 위한 Python의 특정 코드를 공유합니다. 구체적인 내용은 다음과 같습니다

자세한 Baidu 음성 인식 API 문서

먼저 Python SDK를 다운로드하고 Python 설정을 사용할 수 있습니다. py installinstall

# 引入Speech SDK
from aip import AipSpeech
# 定义常量
APP_ID = '你的 App ID'
API_KEY = '你的 API Key'
SECRET_KEY = '你的 Secret Key'
# 初始化AipSpeech对象
aipSpeech = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

위 코드에서 상수 APP_ID는 Baidu Cloud 콘솔에서 생성됩니다. 상수 API_KEY 및 SECRET_KEY는 애플리케이션이 생성된 후 시스템에 의해 사용자에게 할당됩니다. 사용자 식별 및 접근 서명에 사용됩니다. 인증은 AI 서비스 콘솔의 애플리케이션 목록에서 볼 수 있습니다.

인식 시작

주의: 지침 요청:

1 현재 원본 음성의 녹음 형식은 평가를 위해 8k/16k 샘플링 속도와 16비트 비트 깊이의 모노 음성만 지원합니다

2. 압축 형식 지원: pcm(비압축), wav, amr
3 시스템은 중국어(zh), 광둥어(ct), 영어(en)를 지원합니다.

# 读取文件
def get_file_content(filePath):
  with open(filePath, 'rb') as fp:
    return fp.read()
# 识别本地文件
aipSpeech.asr(get_file_content('audio.pcm'), 'pcm', 16000, {
  'lan': 'zh',
})
# 从URL获取文件识别
aipSpeech.asr('', 'pcm', 16000, {
  'url': 'http://121.40.195.233/res/16k_test.pcm',
  'callback': 'http://xxx.com/receive',
})

반환 결과:
// 成功返回
{
  "err_no": 0,
  "err_msg": "success.",
  "corpus_no": "15984125203285346378",
  "sn": "481D633F-73BA-726F-49EF-8659ACCC2F3D",
  "result": ["北京天气"]
}
// 失败返回
{
  "err_no": 2000,
  "err_msg": "data empty.",
  "sn": null
}

이 기사의 사례를 읽으신 후 방법을 마스터하셨다고 생각합니다. 더 흥미로운 정보를 보려면 PHP 중국어 웹사이트의 다른 관련 기사에 주목하세요!

추천 자료:

파이썬이 스마트 답장 기능을 구현하기 위해 API를 호출하는 방법


파이썬이 데이터 프레임의 시간 필드를 처리하는 방법


파이썬이 텍스트 데이터를 읽고 이를 DataFrame 형식으로 변환하는 방법에 대한 자세한 설명

위 내용은 Python에서 Baidu 음성 인식 API를 구현하는 방법에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.