>  기사  >  기술 주변기기  >  인공지능: 음성인식 기술

인공지능: 음성인식 기술

王林
王林앞으로
2023-05-04 11:22:062424검색

오늘은 음성인식에 관한 몇 가지 지식을 소개하겠습니다. 도움이 되셨으면 좋겠습니다!

1. 말이란 무엇인가요?

말이란 인간이 발성기관을 통해 내는 소리로, 특정한 의미를 가지며 의사소통에 사용됩니다.

컴퓨터의 음성 저장: 파형 파일 형태로 저장됩니다. 음성의 변화가 파형을 통해 반영되므로 소리 강도 및 소리 길이와 같은 매개변수 정보를 얻을 수 있습니다.

음성 범위 매개변수: 푸리에 스펙트럼, 멜 주파수에서 스펙트럼 계수까지, 주로 음성 정보를 추가로 식별하기 위해 음성 내용과 음색의 차이를 추출하는 데 사용됩니다.

2. 음성 인식이란 무엇인가요?

음성 인식은 단순히 음성 내용을 텍스트로 자동 변환하는 과정입니다.

관련분야: 음향학, 인공지능, 디지털 신호처리, 심리학 등

음성 인식 입력: 사운드 파일 재생 순서.

음성 인식 출력: 출력 결과는 텍스트 시퀀스입니다.

3. 음성 인식의 원리

음성 인식에는 특징 추출, 음향 모델, 음성 모델, 음성 디코딩 및 검색 알고리즘의 네 부분이 필요합니다.

특징 추출: 원본 신호에서 분석할 신호를 추출합니다. 이 단계에는 음성 진폭 표준화, 주파수 응답 보정, 프레이밍, 윈도잉, 시작 및 끝 지점 감지 등의 전처리 작업이 주로 포함됩니다. 음향 모델.

음향 모델: 음향 모델을 사용하여 음성 매개변수(음성 포먼트 주파수, 진폭 등)를 분석하고 음성의 선형 예측 매개변수를 분석합니다.

언어 모델: 관련 언어 이론을 기반으로 사운드 클립의 가능한 구문 시퀀스 확률을 계산합니다.

음성 디코딩 및 검색 알고리즘: 음향 모델 + 발음 사전 + 음성 모델로 구성된 검색 공간을 기반으로 가장 적합한 경로를 찾습니다. 디코딩이 완료되면 최종적으로 텍스트가 출력됩니다.

4. 음성 인식 시스템의 구성

완전한 음성 인식 시스템에는 전처리, 특징 추출, 음향 모델 훈련, 언어 모델 훈련 및 음성 디코더가 포함됩니다.

4.1 전처리

입력된 원래 사운드 신호를 처리하고, 배경 소음과 중요하지 않은 정보를 필터링하고, 음성 신호의 시작과 끝을 찾고, 음성의 프레임을 만들고, 신호의 고주파수 부분을 강화합니다. 작업을 기다리십시오.

4.2 특징 추출

가장 일반적으로 사용되는 특징 추출 방법은 MFCC(Melton Spectral Coefficient)인데, 이는 잡음 내성이 좋고 견고함을 갖기 때문입니다.

4.3 음향 모델 훈련

음향 모델 매개변수는 Xuanlian 음성 라이브러리의 특성 매개변수를 기반으로 훈련되므로 인식 중에 음향 모델과 일치시켜 해당 결과를 얻을 수 있습니다. 현재 주류 음성 인식 시스템은 일반적으로 음향 모델 모델링에 HMM을 사용합니다.

4.4 언어 모델 훈련

은 어떤 단어 순서가 더 정확할지 예측하는 데 사용됩니다.

4.5 음성 디코더

디코더는 입력된 음성 신호를 기반으로 학습된 HMM 음향 모델, 언어 모델 및 발음 사전을 사용하여 검색 공간을 구축합니다. 알고리즘 가장 적합한 경로를 찾습니다. 가장 적합한 단어 문자열을 찾으려면.

5. 음성인식 활용 시나리오

음성인식은 일상생활에서 널리 활용되고 있으며 크게 폐쇄형과 개방형으로 나누어진다.

폐쇄된 애플리케이션: 주로 특정 제어 명령에 대한 애플리케이션을 나타냅니다.

예를 들어, 음성 명령을 통해 조명 스위치, 온수기 스위치, 온도 조절, 에어컨 켜기 등을 제어하는 ​​스마트 홈이 널리 보급되어 일상 생활을 크게 풍요롭게 합니다.

오픈 애플리케이션: 주로 오픈 애플리케이션이 제공합니다. 제조업체의 음성 인식 서비스는 일반적으로 퍼블릭 클라우드 또는 프라이빗 클라우드에 배포되며 서비스를 사용하는 고객이 음성 인식 서비스를 호출할 수 있도록 해당 SDK를 제공합니다.

일반적인 시나리오에는 입력 방법, 회의 자막 실시간 출력, 비디오 편집 자막 구성 등이 포함됩니다.

위 내용은 인공지능: 음성인식 기술의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제