一行字实现3D换脸！UC伯克利提出「Chat-NeRF」，说句话完成大片级渲染

一行字实现3D换脸！UC伯克利提出「Chat-NeRF」，说句话完成大片级渲染

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 12, 2023 pm 02:37 PM

3d换脸uc

由于神经3D重建技术的发展，捕获真实世界3D场景的特征表示从未如此简单。

然而，在此之上的3D场景编辑却一直未能有一个简单有效的方案。

最近，来自UC伯克利的研究人员基于此前的工作InstructPix2Pix，提出了一种使用文本指令编辑NeRF场景的方法——Instruct-NeRF2NeRF。

论文地址：https://arxiv.org/abs/2303.12789

利用Instruct-NeRF2NeRF，我们只需一句话，就能编辑大规模的现实世界场景，并且比以前的工作更真实、更有针对性。

比如，想要他有胡子，脸上就会出现一簇胡子！

或者直接换头，秒变成爱因斯坦。

此外，由于模型能不断地使用新的编辑过的图像更新数据集，所以场景的重建效果也会逐步得到改善。

NeRF + InstructPix2Pix = Instruct-NeRF2NeRF

具体来说，人类需要给定输入图像，以及告诉模型要做什么的书面指令，随后模型就会遵循这些指令来编辑图像。

实现步骤如下：

在训练视角下从场景中渲染出一张图像。
使用InstructPix2Pix模型根据全局文本指令对该图像进行编辑。
用编辑后的图像替换训练数据集中的原始图像。
NeRF模型按照往常继续进行训练。

实现方法

相比于传统的三维编辑，NeRF2NeRF是一种新的三维场景编辑方法，其最大的亮点在于采用了「迭代数据集更新」技术。

虽然是在3D场景上进行编辑，但论文中使用2D而不是3D扩散模型来提取形式和外观先验，因为用于训练3D生成模型的数据非常有限。

这个2D扩散模型，就是该研究团队不久前开发的InstructPix2Pix——一款基于指令文本的2D图像编辑模型，输入图像和文本指令，它就能输出编辑后的图像。

然而，这种2D模型会导致场景不同角度的变化不均匀，因此，「迭代数据集更新」应运而生，该技术交替修改NeRF的「输入图片数据集」，并更新基础3D表征。

这意味着文本引导扩散模型（InstructPix2Pix）将根据指令生成新的图像变化，并将这些新图像用作NeRF模型训练的输入。因此，重建的三维场景将基于新的文本引导编辑。

在初始迭代中，InstructPix2Pix通常不能在不同视角下执行一致的编辑，然而，在NeRF重新渲染和更新的过程中，它们将会收敛于一个全局一致的场景。

总结而言，NeRF2NeRF方法通过迭代地更新图像内容，并将这些更新后的内容整合到三维场景中，从而提高了3D场景的编辑效率，还保持了场景的连贯性和真实感。

可以说，UC伯克利研究团队的此项工作是此前InstructPix2Pix的延伸版，通过将NeRF与InstructPix2Pix结合，再配合「迭代数据集更新」，一键编辑照样玩转3D场景！

仍有局限，但瑕不掩瑜

不过，由于Instruct-NeRF2NeRF是基于此前的InstructPix2Pix，因此继承了后者的诸多局限，例如无法进行大规模空间操作。

此外，与DreamFusion一样，Instruct-NeRF2NeRF一次只能在一个视图上使用扩散模型，所以也可能会遇到类似的伪影问题。

下图展示了两种类型的失败案例：

（1）Pix2Pix无法在2D中执行编辑，因此NeRF2NeRF在3D中也失败了；

（2）Pix2Pix在2D中可以完成编辑，但在3D中存在很大的不一致性，因此NeRF2NeRF也没能成功。

再比如下面这只「熊猫」，不仅看起来非常凶悍（作为原型的雕像就很凶），而且毛色多少也有些诡异，眼睛在画面移动时也有明显的「穿模」。

自从ChatGPT，Diffusion, NeRFs被拉进聚光灯之下，这篇文章可谓充分发挥了三者的优势，从「AI一句话作图」进阶到了「AI一句话编辑3D场景」。

尽管方法存在一些局限性，但仍瑕不掩瑜，为三维特征编辑给出了一个简单可行的方案，有望成为NeRF发展的里程碑之作。

一句话编辑3D场景

最后，再看一波作者放出的效果。

不难看出，这款一键PS的3D场景编辑神器，不论是指令理解能力，还是图像真实程度，都比较符合预期，未来也许会成为学术界和网友们把玩的「新宠」，继ChatGPT后打造出一个Chat-NeRFs。

即便是随意改变图像的环境背景、四季特点、天气，给出的新图像也完全符合现实逻辑。

原图：

秋天：

雪天：

沙漠：

暴风雨：

参考资料：https://www.php.cn/link/ebeb300882677f350ea818c8f333f5b9

以上是一行字实现3D换脸！UC伯克利提出「Chat-NeRF」，说句话完成大片级渲染的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文转载于：51CTO.COM。如有侵权，请联系admin@php.cn删除

如何成为统计学家？

如何成为统计学家？Apr 15, 2025 am 09:15 AM

介绍想象一下，有能力在医疗保健，金融或体育等领域为自己和您的公司做出明智的决定。那就是统计学家的角色。随着组织中数据的越来越多，对统计学家的需求

什么是象形图？ - 分析Vidhya

什么是象形图？ - 分析VidhyaApr 15, 2025 am 09:09 AM

介绍在数据分析的世界中，有效的沟通是关键。象形图提供了一个强大的解决方案，以视觉上吸引人且易于消化的格式提供信息。与复杂的图表和数字不同，象形文字 - 也

Llama-3.1-STORM-8B：8B LLM优于元和爱马仕

Llama-3.1-STORM-8B：8B LLM优于元和爱马仕Apr 15, 2025 am 09:08 AM

Llama 3.1风暴8b：有效语言模型的突破追求高效，准确的语言模型导致了Llama 3.1 Storm 8b的发展，这是80亿个参数模型类别的显着进步。这是完善的

如何安装git？ - 分析Vidhya

如何安装git？ - 分析VidhyaApr 15, 2025 am 09:07 AM

git：您的版本控制与协作的基本指南 Git是开发人员的关键工具，简化了项目协作和版本控制。本指南提供了在Linux，MacOS和Wind上安装GIT的直接说明

在LLMS中调用工具

在LLMS中调用工具Apr 14, 2025 am 11:28 AM

大型语言模型（LLMS）的流行激增，工具称呼功能极大地扩展了其功能，而不是简单的文本生成。现在，LLM可以处理复杂的自动化任务，例如Dynamic UI创建和自主a

多动症游戏，健康工具和AI聊天机器人如何改变全球健康

多动症游戏，健康工具和AI聊天机器人如何改变全球健康Apr 14, 2025 am 11:27 AM

视频游戏可以缓解焦虑，建立焦点或支持多动症的孩子吗？随着医疗保健在全球范围内挑战，尤其是在青年中的挑战，创新者正在转向一种不太可能的工具：视频游戏。现在是世界上最大的娱乐印度河之一

没有关于AI的投入：获胜者，失败者和机遇

没有关于AI的投入：获胜者，失败者和机遇Apr 14, 2025 am 11:25 AM

“历史表明，尽管技术进步推动了经济增长，但它并不能自行确保公平的收入分配或促进包容性人类发展，”乌托德秘书长Rebeca Grynspan在序言中写道。

通过生成AI学习谈判技巧

通过生成AI学习谈判技巧Apr 14, 2025 am 11:23 AM

易于使用，使用生成的AI作为您的谈判导师和陪练伙伴。让我们来谈谈。对创新AI突破的这种分析是我正在进行的《福布斯》列的最新覆盖范围的一部分，包括识别和解释

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么（黄色晶体）

4 周前By尊渡假赌尊渡假赌尊渡假赌

R.E.P.O.最佳图形设置

4 周前By尊渡假赌尊渡假赌尊渡假赌

刺客信条阴影：贝壳谜语解决方案

2 周前ByDDD

R.E.P.O.如果您听不到任何人，如何修复音频

4 周前By尊渡假赌尊渡假赌尊渡假赌

WWE 2K25：如何解锁Myrise中的所有内容

1 个月前By尊渡假赌尊渡假赌尊渡假赌

热工具

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

安全考试浏览器

安全考试浏览器

Safe Exam Browser是一个安全的浏览器环境，用于安全地进行在线考试。该软件将任何计算机变成一个安全的工作站。它控制对任何实用工具的访问，并防止学生使用未经授权的资源。

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

螳螂BT

螳螂BT

Mantis是一个易于部署的基于Web的缺陷跟踪工具，用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

WebStorm Mac版

WebStorm Mac版

好用的JavaScript开发工具

热门话题

gmail邮箱登陆入口在哪里

7507

15

1378

52

steam的账户名称是什么格式

78

11

win11激活密钥永久

52

19

NYT连接提示和答案

19

55