PyPI中有一些現成的語音辨識軟體包。其中包括:
apiai
google-cloud-speech
pocketsphinx
SpeechRcognition
watson-developer-cloud
wit
一些軟體包(如wit 和apiai )提供了一些超出基本語音辨識的內建功能,如辨識說話者意圖的自然語言處理功能。其他軟體包,如Google雲端語音,則專注於語音向文字的轉換。
其中,SpeechRecognition 就因為便於使用而脫穎而出。
識別語音需要輸入音頻,而在 SpeechRecognition 中檢索音頻輸入是非常簡單的,它無需構建訪問麥克風和從頭開始處理音頻文件的腳本,只需幾分鐘即可自動完成檢索並運行。
但透過指令:pip3 install SpeechRecognition安裝相關的語音包時出現了連線逾時的問題。
SpeechRecognition 的核心就是辨識器類別。
Recognizer API 主要目是辨識語音,每個API 都有多種設定和功能來辨識音訊來源的語音,分別是:
recognize_bing(): Microsoft Bing Speech
recognize_google(): Google Web Speech API
recognize_google_cloud(): Google Cloud Speech - requires installation of the google-cloud-speech package
recognize_houndify(): Houndify by SoundHound
recognize_ibm(): IBM Speech to gnize#recognize_ibm(): IBM Speech: : CMU Sphinx - requires installingPocketSphinx
recognize_wit(): Wit.ai
以上七個中只有recognition_sphinx()可與CMU Sphinx 引擎離線工作, 其他六個都需要連接互聯網。
因此我選擇了用 recognition_sphinx()來進行語音辨識。
當使用pip3 install PocketSphinx下載相關函式庫時出現了以下問題:
在使用
pip3 install PocketSphinx該指令前應該使用
sudo apt install python-pocketsphinx。然後再使用
pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple PocketSphinx該指令應該就可以安裝成功了。如果依舊不能成功則可以使用指令
sudo apt-get install python python-all-dev python-pip build-essential swig git libpulse-dev libasound2-dev。一般出現這種問題都是缺乏相關的依賴!
以上是Linux下如何安裝PocketSphinx的詳細內容。更多資訊請關注PHP中文網其他相關文章!