IT之家 6 月 2 日消息,英伟达公司于本周宣布推出一款名为 Neuralangelo 的 AI 模型,该模型能够将视频片段转化为细节层次丰富、具备贴图的 3D 模型。
▲ 图源 英伟达
IT之家查询得知,此前也已经有数个基于视频内容生成 3D 模型的 AI,但这些 AI 往往在面对低对比度视频时便无法着手。而英伟达的 Neuralangelo 模型采用了即时神经绘图(instant neural graphics primitives),并利用了自家的 Instant NeRF 技术,因此即使是对于低对比度的视频,也可以从中捕捉到微妙的细节,并转换为更具备商业价值的 3D 模型。
▲ 图源 英伟达
英伟达强调,Neuralangelo 的独到之处主要表现在其“准确性”与“普适性”:
▲ 图源 英伟达
Neuralangelo 模型利用从不同角度拍摄的物品的视频作为输入素材,来生成创作者们所需要的模型。一旦 Neuralangelo 确定了视频中相机的运动规律,它就会生成模型的 3D 轮廓,并开始在上面雕刻出细节。
▲ 图源 英伟达
预计英伟达将在 6 月 18 日至 22 日举行的电脑视觉与样式辨识(Computer Vision and Pattern Recognition,CVPR)大会上发布 Neuralangelo 模型。在内部演示中,英伟达展示了 Neuralangelo 模型重建的米开朗基罗著名雕刻作品《大卫》、英伟达位于湾区的办公室、及平板拖车等日常见到的物品的 3D 还原模型。
▲ 图源 英伟达
英伟达在会议上展示的模型除了 Neuralangelo,还包括名为DiffCollage的一款。DiffCollage 是一种能够通过文字提示词生成视频的 AI 模型,可以生成 360 度全景图像与循环动态图像,并再将这些图像扩展为具体的视频。
英伟达研究部高级主任、论文作者 Ming-Yu Liu 对这项研究的意义给出了畅想:
Neuralangelo 提供的 3D 重建能力将给创作者带来巨大好处,帮助他们在数字世界中重建真实世界。这个工具最终将使开发人员能够将精细的物体 —— 不论是小型雕像,还是大型建筑 —— 导入视频游戏或工业数字孪生的虚拟环境中。
IT之家的小伙伴们可以在这里找到论文的具体内容。
以上是英伟达公布 Neuralangelo AI模型,可将视频内容转换为高精3D模型的详细内容。更多信息请关注PHP中文网其他相关文章!