2023-06-21 05:17:13 作者:老王
最近,Meta推出了名為Voicebox的人工智慧語音模型。相較於通常專注於文字和圖像的模型,Voicebox能夠創造出用於回應的聲音訊息。據報道,這個模型可以在僅2秒的音訊樣本中準確辨識音訊細節和音色,並將文字結果轉換為語音輸出。目前,Voicebox支援英語、法語、德語和西班牙語。 Voicebox能夠根據語音片段前後的內容來填補中間缺失部分。
此技術可為虛擬助理或元宇宙中的NPC提供自然真實的語音效果。 Voicebox可協助聲帶受損者實現無障礙功能。然而,Voicebox目前仍處於研發階段。 Meta表示,這類人工智慧技術可能在虛假偽造品方面產生潛在危害,因此公司正努力尋找有效區分真實語音和Voicebox產生音訊的方法。在找到解決方案之前,該模型不會向公眾公開提供。
以上是Meta發布語音AI模型 Voicebox 輔助虛擬助理與NPC對話的詳細內容。更多資訊請關注PHP中文網其他相關文章!