Meta 最近發布了 AI 翻譯套件 Seamless Communication。這個套件包含了四個AI 模型,Meta 聲稱這個AI 套件能夠準確地再現說話者的情緒,並且能夠實現僅有兩秒的延遲的同聲傳譯能力,同時還支持近百種語言的輸入
據悉,Seamless Communication 是 Meta 慶祝自家 AI 研究機構「Fundamental AI Research」成立 10 週年所發表的研究成果。
Meta介紹稱,該套件包含用於加速翻譯的"第二代SeamlessM4T模型"、口譯模型"Seamless Expressive"、同聲翻譯模型"Seamless Streaming",以及綜合模型"Seamless"。以下是IT之家整理的相關資訊:
SeamlessM4T 模型聲稱能夠根據使用者的說話內容,在翻譯過程中自動聯想可能的後文,以加快翻譯速度
Seamless Expressive是一種口譯模型,據稱可以解決傳統AI翻譯無法抓住用戶語調、停頓、讀詞重輕度的問題,並能夠在保持翻譯品質的基礎上,保留用戶情感、風格、說話速度、停頓和節奏,從而為翻譯內容帶來更多情感訊息
Seamless Streaming 是一個同聲傳譯模型,專注於提供 2 秒延遲的語音和文字翻譯,支援即時口譯、語音轉文字翻譯(S2TT)以及自動語音辨識功能(ASR)
而綜合模型 Seamless,則是整合了上述三種語言模型,以便於通用場景。
目前 Meta 已經將範例影片發佈在 GitHub 以及 HuggingFace 網站上,有興趣的小夥伴們可以點此進行查看。
以上是Meta 推出 AI 翻譯套件 Seamless Communication的詳細內容。更多資訊請關注PHP中文網其他相關文章!