搜索
首页科技周边人工智能五官乱飞,张嘴、瞪眼、挑眉,AI都能模仿到位,视频诈骗要防不住了

如此强大的AI模仿能力,真的防不住,完全防不住。现在AI的发展已经达到了这种程度吗?

你前脚让自己的五官乱飞,后脚,一模一样的表情就被复现出来,瞪眼、挑眉、嘟嘴,不管多么夸张的表情,都模仿的非常到位。

五官乱飞,张嘴、瞪眼、挑眉,AI都能模仿到位,视频诈骗要防不住了

加大难度,让眉毛挑的再高些,眼睛睁的再大些,甚至连嘴型都是歪的,虚拟人物头像也能完美复现表情。

五官乱飞,张嘴、瞪眼、挑眉,AI都能模仿到位,视频诈骗要防不住了

当你在左侧调整参数时,右侧的虚拟头像也会相应地改变动作

五官乱飞,张嘴、瞪眼、挑眉,AI都能模仿到位,视频诈骗要防不住了

给嘴巴、眼睛一个特写,模仿的不能说完全相同,只能说表情一模一样(最右边)。

五官乱飞,张嘴、瞪眼、挑眉,AI都能模仿到位,视频诈骗要防不住了

这项研究来自慕尼黑工业大学等机构,他们提出了 GaussianAvatars,这种方法可用来创建在表情,姿态和视角( viewpoint )方面完全可控的逼真头部虚拟( head avatars)。

五官乱飞,张嘴、瞪眼、挑眉,AI都能模仿到位,视频诈骗要防不住了


  • 论文地址:https://arxiv.org/pdf/2312.02069.pdf
  • 论文主页:https://shenhanqian.github.io/gaussian-avatars

在计算机视觉和图形学领域,创造出能够动态展现人类虚拟头部一直是一个具有挑战性的问题。特别是在表现极端面部表情和细节方面,例如皱纹和头发等细节的捕捉相当困难,生成的虚拟人物往往会出现视觉伪影的问题

在过去的一段时间里,神经辐射场(NeRF)及其变种已经在从多视图观察中重建静态场景方面取得了令人印象深刻的成果。随后的研究扩展了这些方法,使得NeRF能够用于人类定制场景的动态场景建模。然而,这些方法的一个缺点是缺乏可控性,因此无法很好地适应新的姿态和表情

最近出现的「3D高斯喷洒」方法实现了比NeRF更高的渲染质量,可用于实时视图合成。然而,该方法不支持重建输出的动画

本文提出了 GaussianAvatars,这是一种基于三维高斯 splats 的动态 3D 人头表示方法。

具体而言,给定一个 FLAME(对整个头部进行建模)网格 ,他们在每个三角形的中心初始化一个 3D 高斯。当将 FLAME 网格动画化时,每个高斯模型都会根据其父三角形进行平移、旋转和缩放。然后,3D 高斯在网格顶部形成辐射场,补偿网格未准确对齐或无法再现某些视觉元素的区域。

为了保持虚拟人物的高度真实感,本文采用了绑定继承策略。同时,本文还研究了如何在保持真实感和稳定性之间取得平衡,以实现虚拟人物的新颖表情和姿态动画化。研究结果显示,与现有研究相比,GaussianAvatars在新颖视图渲染和驾驶视频重现等方面表现出色

五官乱飞,张嘴、瞪眼、挑眉,AI都能模仿到位,视频诈骗要防不住了

方法简介


如下图 2 所示,GaussianAvatars 的输入是人头的多视图视频记录。对于每个时间步,GaussianAvatars 使用光度头部跟踪器(head tracker)将 FLAME 参数与多视图观察和已知相机参数相匹配。

五官乱飞,张嘴、瞪眼、挑眉,AI都能模仿到位,视频诈骗要防不住了

FLAME 网格的顶点位置各不相同,但拓扑结构相同,因此研究团队可以在网格三角形和 3D 高斯splat之间建立一致的连接。利用可微分的图块光栅器(tile rasterizer)将splat渲染成图像。然后,通过真实图像监督,学习逼真的人体头部头像

为了获得最佳质量,静态场景需要通过一组自适应密度控制操作来紧凑和修剪高斯splat。为了实现这一点,研究团队设计了一种绑定继承策略,使新的高斯点与FLAME网格保持绑定,同时不破坏三角形和splat之间的连接

实验结果

该研究使用新的视角合成技术来评估重建质量,并通过自我复现来评估动画的保真度。下图3显示了不同方法之间的定性比较结果。在新的视角合成方面,所有的方法都能够产生合理的渲染结果。但是,通过仔细检查PointAvatar的结果,可以发现由于其固定的点大小,会出现点状伪影。而采用3D高斯各向异性缩放技术的GaussianAvatars则能够缓解这个问题

五官乱飞,张嘴、瞪眼、挑眉,AI都能模仿到位,视频诈骗要防不住了

我们可以从表1的数量比较中得出相似的结论。与其他方法相比,GaussianAvatars在新视图合成方面表现出色,self-reenactment方面也很出色,在LPIPS方面感知差异明显降低。需要注意的是,self-reenactment是基于FLAME网格跟踪的,可能无法完全对齐目标图像

五官乱飞,张嘴、瞪眼、挑眉,AI都能模仿到位,视频诈骗要防不住了

为了测试虚拟形象动画在现实世界中的表现,该研究进行了图4中的跨身份再现实验。结果显示,虚拟形象准确地再现了源演员的眨眼和嘴巴动作,呈现出活泼复杂的动态,如皱纹等

五官乱飞,张嘴、瞪眼、挑眉,AI都能模仿到位,视频诈骗要防不住了


五官乱飞,张嘴、瞪眼、挑眉,AI都能模仿到位,视频诈骗要防不住了

为了验证方法组件的有效性,该研究还进行了消融实验,结果如下图。

五官乱飞,张嘴、瞪眼、挑眉,AI都能模仿到位,视频诈骗要防不住了

以上是五官乱飞,张嘴、瞪眼、挑眉,AI都能模仿到位,视频诈骗要防不住了的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:51CTO.COM。如有侵权,请联系admin@php.cn删除
及时工程中的思想图是什么及时工程中的思想图是什么Apr 13, 2025 am 11:53 AM

介绍 在迅速的工程中,“思想图”是指使用图理论来构建和指导AI的推理过程的新方法。与通常涉及线性S的传统方法不同

优化您的组织与Genai代理商的电子邮件营销优化您的组织与Genai代理商的电子邮件营销Apr 13, 2025 am 11:44 AM

介绍 恭喜!您经营一家成功的业务。通过您的网页,社交媒体活动,网络研讨会,会议,免费资源和其他来源,您每天收集5000个电子邮件ID。下一个明显的步骤是

Apache Pinot实时应用程序性能监视Apache Pinot实时应用程序性能监视Apr 13, 2025 am 11:40 AM

介绍 在当今快节奏的软件开发环境中,确保最佳应用程序性能至关重要。监视实时指标,例如响应时间,错误率和资源利用率可以帮助MAIN

Chatgpt击中了10亿用户? Openai首席执行官说:'短短几周内翻了一番Chatgpt击中了10亿用户? Openai首席执行官说:'短短几周内翻了一番Apr 13, 2025 am 11:23 AM

“您有几个用户?”他扮演。 阿尔特曼回答说:“我认为我们上次说的是每周5亿个活跃者,而且它正在迅速增长。” “你告诉我,就像在短短几周内翻了一番,”安德森继续说道。 “我说那个私人

pixtral -12b:Mistral AI'第一个多模型模型 - 分析Vidhyapixtral -12b:Mistral AI'第一个多模型模型 - 分析VidhyaApr 13, 2025 am 11:20 AM

介绍 Mistral发布了其第一个多模式模型,即Pixtral-12b-2409。该模型建立在Mistral的120亿参数Nemo 12B之上。是什么设置了该模型?现在可以拍摄图像和Tex

生成AI应用的代理框架 - 分析Vidhya生成AI应用的代理框架 - 分析VidhyaApr 13, 2025 am 11:13 AM

想象一下,拥有一个由AI驱动的助手,不仅可以响应您的查询,还可以自主收集信息,执行任务甚至处理多种类型的数据(TEXT,图像和代码)。听起来有未来派?在这个a

生成AI在金融部门的应用生成AI在金融部门的应用Apr 13, 2025 am 11:12 AM

介绍 金融业是任何国家发展的基石,因为它通过促进有效的交易和信贷可用性来推动经济增长。交易的便利和信贷

在线学习和被动攻击算法指南在线学习和被动攻击算法指南Apr 13, 2025 am 11:09 AM

介绍 数据是从社交媒体,金融交易和电子商务平台等来源的前所未有的速度生成的。处理这种连续的信息流是一个挑战,但它提供了

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
4 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

WebStorm Mac版

WebStorm Mac版

好用的JavaScript开发工具

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

Atom编辑器mac版下载

Atom编辑器mac版下载

最流行的的开源编辑器

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具