IT之家6 月19 日消息,Meta 目前發布了Voicebox AI 模型,相對於只能使用文字或圖片回复的競品模型,Voicebox AI 模型的優勢主要如其名,能夠生成用於回复的音頻消息。
▲ Voicebox AI 模型的特色,圖源 Meta
據悉,Voicebox AI 模型只需要一段 2 秒鐘的音訊樣本,即可準確辨別音訊細節、音色,並基於文字結果轉換為語音輸出,支援英語、法語、德語、西班牙語。 Voicebox也具備根據語音片段前後內容來填補中間缺失內容的能力。
▲ Voicebox AI 模型的特色,圖源 Meta
▲ Voicebox AI 模型的特色,圖源 Meta
Meta 表示,Voicebox 可以為基於 AI 的虛擬助理或元宇宙中的 NPC 提供自然而真實的語音效果。 Voicebox可以提供一定的協助,幫助聲帶受損的人實現無障礙通訊。
經過查詢,IT之家發現Voicebox AI模型目前仍在研發階段。 Meta 表示,他們意識到這種人工智慧技術在虛假偽造方面,可能會帶來潛在危害,因此Meta 目前正在努力找到一種有效的方式來區分真實語音和由Voicebox 生成的音頻,在找到解決方案之前,暫時不會向公眾公開提供。目前可以在這裡找到 Voicebox 模型的更多資訊。
以上是Meta 發布 Voicebox AI 模型:可產生音訊訊息,用於 NPC 對話等的詳細內容。更多資訊請關注PHP中文網其他相關文章!