Meta 最近发布了 AI 翻译套件 Seamless Communication。这个套件包含了四个 AI 模型,Meta 声称这个 AI 套件能够准确地再现说话者的情绪,并且能够实现仅有两秒的延迟的同声传译能力,同时还支持近百种语言的输入
据悉,Seamless Communication 是 Meta 庆祝自家 AI 研究机构“Fundamental AI Research”成立 10 周年所发表的研究成果。
Meta介绍称,该套件包含用于加速翻译的"第二代SeamlessM4T模型"、口译模型"Seamless Expressive"、同声翻译模型"Seamless Streaming",以及综合模型"Seamless"。以下是IT之家整理的相关信息:
SeamlessM4T 模型声称能够根据用户的说话内容,在翻译过程中自动联想可能的后文,以加快翻译速度
Seamless Expressive是一种口译模型,据称可以解决传统AI翻译无法抓住用户语调、停顿、读词重轻度的问题,并能够在保持翻译品质的基础上,保留用户情感、风格、说话速度、停顿和节奏,从而为翻译内容带来更多情感信息
Seamless Streaming 是一个同声传译模型,专注于提供 2 秒延迟的语音和文字翻译,支持即时口译、语音转文本翻译(S2TT)以及自动语音识别功能(ASR)
而综合模型 Seamless,则是整合了上述三种语言模型,便于通用场景。
目前 Meta 已经将示例视频发布在 GitHub 以及 HuggingFace 网站上,感兴趣的小伙伴们可以点此进行查看。
以上是Meta 推出 AI 翻译套件 Seamless Communication的详细内容。更多信息请关注PHP中文网其他相关文章!