人工智慧：語音辨識技術-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

人工智慧：語音辨識技術

王林

May 04, 2023 am 11:22 AM

人工智慧科技語音辨識

今天要來跟大家介紹一下關於語音辨識相關的知識，希望對大家有幫助！

1、什麼是語音

語音指的是人類透過發聲器官發出來具有一定意義、用來溝通溝通的聲音。

電腦中語音儲存：以波形檔案的方式存儲，透過波形反映語音的變化，從而可以獲取音強、音長等參數資訊。

音域參數：傅利葉譜、梅爾頻率到譜係數，主要用來擷取語音內容以及音色的差別，用來更進一步辨別語音訊息。

2、什麼是語音辨識

語音辨識簡單來說就是把語音內容自動轉換為文字的過程，是人與機器互動的一種技術。

涉及領域：聲學、人工智慧、數位訊號處理、心理學等面向。

語音辨識的輸入：對一段聲音檔案進行播放的序列。

語音辨識的輸出：輸出的結果是一段文字序列。

3、語音辨識的原理

語音辨識需要經過特徵擷取、聲學模型、語音模型、語音解碼和搜尋演算法四個部分。

特徵提取：把要分析的訊號從最原始訊號提取出來，這個階段主要是對語音的幅度標準化、頻響校正、分幀、加窗、始末端點檢測等預處理操作，為聲學模型提供需要特徵向量。

聲學模型：依靠聲學模型進行語音參數分析（語音共振峰頻率、振幅等）和對語音的線性預測參數進行分析。

語言模型：根據相關語言學理論，計算出聲音片段可能詞組序列的機率。

語音解碼與搜尋演算法：根據聲學模型發音字典語音模型建立的搜尋空間，找到最合適的路徑。解碼完成後最終輸出文字。

4、語音辨識系統的組成

一個完整的語音辨識系統包括：預處理、特徵提取、聲學模型訓練、語言模型訓練、語音解碼器。

4.1 預處理

對輸入的原始聲音訊號進行處理，過濾掉其中的背景噪音、非重要訊息，還要對找到語音訊號的開始和結束、語音分幀、提升高頻部分的訊號等操作。

4.2 特徵提取

最常用的特徵提取方法為梅爾頓到譜係數(MFCC),因為它擁有良好的抗噪性和健全性。

4.3 聲學模型訓練

根據懸戀語音庫的特徵參數訓練出聲學模型參數，從而可以在識別時與聲學模型進行匹配得到相應結果。目前主流語音辨識系統一般都會採用HMM進行聲學模型建模。

4.4 語言模型訓練

用來預測哪個字序列正確的可能性較大。

4.5 語音解碼器

解碼器也就是語音辨識技術中的辨識過程，根據輸入的語音訊號，然後和訓練好的HMM聲學模型、語言模型、發音字典建立一個搜尋空間，根據搜尋演算法找到最適合的路徑。從而找到最適合的詞串。

5、語音辨識的使用場景

語音辨識在日常生活中使用非常廣泛主要分為封閉式和開放式應用。

封閉式應用：主要指針對特定控制指令的應用。

例如常見的有智慧家庭例如透過語音指令控制燈開關、熱水器開關溫度調節、打開空調等，大大豐富了我們日常的生活；

開放式應用：開放式主要是廠商提供語音辨識服務，一般會公有雲或私有雲的方式部署提供對應的SDK，讓使用服務的客戶進行語音辨識服務的呼叫。

常見的場景有輸入法、會議字幕即時輸出、影片剪輯字幕配置等場景。

以上是人工智慧：語音辨識技術的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：51CTO.COM。如有侵權，請聯絡admin@php.cn刪除

外推指南Apr 15, 2025 am 11:38 AM

介紹假設有一個農民每天在幾週內觀察農作物的進展。他研究了增長率，並開始思考他的植物在幾週內可以生長的高度。從Th

軟AI的興起及其對當今企業的意義Apr 15, 2025 am 11:36 AM

軟AI（被定義為AI系統，旨在使用近似推理，模式識別和靈活的決策執行特定的狹窄任務 - 試圖通過擁抱歧義來模仿類似人類的思維。但是這對業務意味著什麼

為AI前沿的不斷發展的安全框架Apr 15, 2025 am 11:34 AM

答案很明確 - 只是雲計算需要向雲本地安全工具轉變，AI需要專門為AI獨特需求而設計的新型安全解決方案。雲計算和安全課程的興起在

生成AI的3種方法放大了企業家：當心平均值！Apr 15, 2025 am 11:33 AM

企業家，並使用AI和Generative AI來改善其業務。同時，重要的是要記住生成的AI，就像所有技術一樣，都是一個放大器 - 使得偉大和平庸，更糟。嚴格的2024研究O

Andrew Ng的新簡短課程Apr 15, 2025 am 11:32 AM

解鎖嵌入模型的力量：深入研究安德魯·NG的新課程想像一個未來，機器可以完全準確地理解和回答您的問題。這不是科幻小說；多虧了AI的進步，它已成為R

大語言模型（LLM）中的幻覺是不可避免的嗎？Apr 15, 2025 am 11:31 AM

大型語言模型（LLM）和不可避免的幻覺問題您可能使用了諸如Chatgpt，Claude和Gemini之類的AI模型。這些都是大型語言模型（LLM）的示例，在大規模文本數據集上訓練的功能強大的AI系統

60％的問題 - AI搜索如何消耗您的流量Apr 15, 2025 am 11:28 AM

最近的研究表明，根據行業和搜索類型，AI概述可能導致有機交通下降15-64％。這種根本性的變化導致營銷人員重新考慮其在數字可見性方面的整個策略。新的

麻省理工學院媒體實驗室將人類蓬勃發展成為AI R＆D的核心Apr 15, 2025 am 11:26 AM

埃隆大學（Elon University）想像的數字未來中心的最新報告對近300名全球技術專家進行了調查。由此產生的報告“ 2035年成為人類”，得出的結論是，大多數人擔心AI系統加深的採用

See all articles

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

AI Hentai Generator

免費產生 AI 無盡。

熱工具

SublimeText3 Linux新版

SublimeText3 Linux最新版

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。

VSCode Windows 64位元下載

微軟推出的免費、功能強大的一款IDE編輯器

Dreamweaver Mac版

視覺化網頁開發工具

Atom編輯器mac版下載

最受歡迎的的開源編輯器

人工智慧：語音辨識技術

1、什麼是語音

2、什麼是語音辨識

3、語音辨識的原理

4、語音辨識系統的組成

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

熱門文章

熱工具

SublimeText3 Linux新版

SAP NetWeaver Server Adapter for Eclipse

VSCode Windows 64位元下載

Dreamweaver Mac版

Atom編輯器mac版下載

熱門話題

人工智慧：語音辨識技術

1、什麼是語音

2、什麼是語音辨識

3、語音辨識的原理

4、語音辨識系統的組成

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

熱門文章

熱工具

SublimeText3 Linux新版

SAP NetWeaver Server Adapter for Eclipse

VSCode Windows 64位元 下載

Dreamweaver Mac版

Atom編輯器mac版下載

熱門話題

VSCode Windows 64位元下載