五官乱飞，张嘴、瞪眼、挑眉，AI都能模仿到位，视频诈骗要防不住了-人工智能-PHP中文网

首页

科技周边

人工智能

五官乱飞，张嘴、瞪眼、挑眉，AI都能模仿到位，视频诈骗要防不住了

PHPz

Dec 14, 2023 pm 11:30 PM

数据智能

如此强大的AI模仿能力，真的防不住，完全防不住。现在AI的发展已经达到了这种程度吗？

你前脚让自己的五官乱飞，后脚，一模一样的表情就被复现出来，瞪眼、挑眉、嘟嘴，不管多么夸张的表情，都模仿的非常到位。

五官乱飞，张嘴、瞪眼、挑眉，AI都能模仿到位，视频诈骗要防不住了

加大难度，让眉毛挑的再高些，眼睛睁的再大些，甚至连嘴型都是歪的，虚拟人物头像也能完美复现表情。

五官乱飞，张嘴、瞪眼、挑眉，AI都能模仿到位，视频诈骗要防不住了

当你在左侧调整参数时，右侧的虚拟头像也会相应地改变动作

五官乱飞，张嘴、瞪眼、挑眉，AI都能模仿到位，视频诈骗要防不住了

给嘴巴、眼睛一个特写，模仿的不能说完全相同，只能说表情一模一样（最右边）。

五官乱飞，张嘴、瞪眼、挑眉，AI都能模仿到位，视频诈骗要防不住了

这项研究来自慕尼黑工业大学等机构，他们提出了 GaussianAvatars，这种方法可用来创建在表情，姿态和视角（ viewpoint ）方面完全可控的逼真头部虚拟（ head avatars）。

五官乱飞，张嘴、瞪眼、挑眉，AI都能模仿到位，视频诈骗要防不住了

论文地址：https://arxiv.org/pdf/2312.02069.pdf
论文主页：https://shenhanqian.github.io/gaussian-avatars

在计算机视觉和图形学领域，创造出能够动态展现人类虚拟头部一直是一个具有挑战性的问题。特别是在表现极端面部表情和细节方面，例如皱纹和头发等细节的捕捉相当困难，生成的虚拟人物往往会出现视觉伪影的问题

在过去的一段时间里，神经辐射场（NeRF）及其变种已经在从多视图观察中重建静态场景方面取得了令人印象深刻的成果。随后的研究扩展了这些方法，使得NeRF能够用于人类定制场景的动态场景建模。然而，这些方法的一个缺点是缺乏可控性，因此无法很好地适应新的姿态和表情

最近出现的「3D高斯喷洒」方法实现了比NeRF更高的渲染质量，可用于实时视图合成。然而，该方法不支持重建输出的动画

本文提出了 GaussianAvatars，这是一种基于三维高斯 splats 的动态 3D 人头表示方法。

具体而言，给定一个 FLAME（对整个头部进行建模）网格，他们在每个三角形的中心初始化一个 3D 高斯。当将 FLAME 网格动画化时，每个高斯模型都会根据其父三角形进行平移、旋转和缩放。然后，3D 高斯在网格顶部形成辐射场，补偿网格未准确对齐或无法再现某些视觉元素的区域。

为了保持虚拟人物的高度真实感，本文采用了绑定继承策略。同时，本文还研究了如何在保持真实感和稳定性之间取得平衡，以实现虚拟人物的新颖表情和姿态动画化。研究结果显示，与现有研究相比，GaussianAvatars在新颖视图渲染和驾驶视频重现等方面表现出色

五官乱飞，张嘴、瞪眼、挑眉，AI都能模仿到位，视频诈骗要防不住了

方法简介

如下图 2 所示，GaussianAvatars 的输入是人头的多视图视频记录。对于每个时间步，GaussianAvatars 使用光度头部跟踪器（head tracker）将 FLAME 参数与多视图观察和已知相机参数相匹配。

五官乱飞，张嘴、瞪眼、挑眉，AI都能模仿到位，视频诈骗要防不住了

FLAME 网格的顶点位置各不相同，但拓扑结构相同，因此研究团队可以在网格三角形和 3D 高斯splat之间建立一致的连接。利用可微分的图块光栅器（tile rasterizer）将splat渲染成图像。然后，通过真实图像监督，学习逼真的人体头部头像

为了获得最佳质量，静态场景需要通过一组自适应密度控制操作来紧凑和修剪高斯splat。为了实现这一点，研究团队设计了一种绑定继承策略，使新的高斯点与FLAME网格保持绑定，同时不破坏三角形和splat之间的连接

实验结果

该研究使用新的视角合成技术来评估重建质量，并通过自我复现来评估动画的保真度。下图3显示了不同方法之间的定性比较结果。在新的视角合成方面，所有的方法都能够产生合理的渲染结果。但是，通过仔细检查PointAvatar的结果，可以发现由于其固定的点大小，会出现点状伪影。而采用3D高斯各向异性缩放技术的GaussianAvatars则能够缓解这个问题

五官乱飞，张嘴、瞪眼、挑眉，AI都能模仿到位，视频诈骗要防不住了