首页  >  文章  >  科技周边  >  微软公布 Text To Speech Avatar AI工具,可制作虚拟3D数字人

微软公布 Text To Speech Avatar AI工具,可制作虚拟3D数字人

WBOY
WBOY转载
2023-11-17 12:50:351161浏览

微软在 Ignite 大会上发布了一项名为“Azure AI Speech text to speech (TTS) avatar”的AI工具,声称可以生成逼真的虚拟人物形象。这项工具已经开放给公众进行预览试用

微软公布 Text To Speech Avatar AI工具,可制作虚拟3D数字人

微软表示,用户使用 Azure AI Speech text to speech (TTS) avatar,可以建立基于“输入文字说出内容”的虚拟化身,并结合现实人物照片训练,建立以真实人物为基础的“互动式聊天机器人”,可用于企业的营销、业务或客户服务等场景。

据报道,Azure AI Speech文字转语音(TTS)avatar主要由三个模块构成,分别是文字分析器、TTS声音合成器和TTS虚拟化身合成器

文字分析器会首先分析用户输入的文字内容,并生成音素序列。然后,TTS声音合成器中的TTS语音模型将预测用户输入文字的声学特征,然后合成声音。最后,神经网络声音合成模型Avatar会根据上述声学特征预测人物的唇形图像,从而最终形成虚拟化身影像

微软解释,传统虚拟化身制作费时耗工,需要建立专用拍摄环境、而拍摄剪辑后期过程也相当花成本。而当下运用微软最新的 Azure AI Speech text to speech (TTS) avatar 服务,在初次建立模型后,用户只要输入文字就可以制作各种产品介绍、互动视频等。配合微软 Azure OpenAI Service 及神经网络 TTS 功能,还能呈现更自然的互动体验。

微软公布 Text To Speech Avatar AI工具,可制作虚拟3D数字人

微软公布 Text To Speech Avatar AI工具,可制作虚拟3D数字人

IT之家报道称,微软举例说明,用户可以利用Azure AI Speech TTS avatar来批量制作各种视频内容,比如企业文化影片、产品介绍,或者CEO在大会上的数字分身。此外,还可以制作虚拟直播数字人、聊天机器人、业务机器人,以及线上教学的AI老师等等

微软公布 Text To Speech Avatar AI工具,可制作虚拟3D数字人

微软宣布,Azure AI语音合成(TTS)虚拟形象已经在Azure订阅用户中推出,并支持多种语言。用户可以从预设的虚拟形象选项中选择所需角色,也可以自定义虚拟形象

微软公布 Text To Speech Avatar AI工具,可制作虚拟3D数字人

如果用户想要自行定制虚拟化身,则需要上传一批人物视频片段,Azure 平台就会在线上处理这些视频,从而生成虚拟化身。角色本身与音源分开,用户可以选择官方提供的默认音源,也可以自行上传训练音源。

以上是微软公布 Text To Speech Avatar AI工具,可制作虚拟3D数字人的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文转载于:sohu.com。如有侵权,请联系admin@php.cn删除