搜尋
首頁科技週邊人工智慧浙大提出新SOTA技術SIFU:只需一張圖片即可重建高品質3D人體模型

在AR、VR、3D打印、场景搭建以及电影制作等多个领域中,高质量的穿着衣服的人体3D模型非常重要。

传统方法创建模型需大量时间,专业设备和技术人员才可完成。

浙大提出新SOTA技術SIFU:只需一張圖片即可重建高品質3D人體模型


相反,在日常生活中,我们通常使用手机相机或在网页上找到的人像照片。

因此,一种能从单张图像准确重建3D人体模型的方法可以显著降低成本,并简化独立创作的过程。

浙大提出新SOTA技術SIFU:只需一張圖片即可重建高品質3D人體模型以往方法(左)与本文方法技术路线比较(右)

以往的深度学习模型用于3D人体重建,往往需要经过三个步骤:从图像中提取2D特征,将2D特征转到3D空间,以及3D特征用于人体重建。

然而这些方法在2D特征转换到3D空间的阶段,往往忽略了人体先验的引入,导致特征的提取不够充分,最终重建结果上会出现各种缺陷。

浙大提出新SOTA技術SIFU:只需一張圖片即可重建高品質3D人體模型SIFU与其他SOTA模型重建效果比较

此外,在对纹理预测的阶段,以往模型仅仅依靠训练集中学得的知识,缺少真实世界的先验知识,也往往导致不可见区域的纹理预测较差。

浙大提出新SOTA技術SIFU:只需一張圖片即可重建高品質3D人體模型

SIFU在纹理预测阶段引入先验知识,增强不可见区域(背部等)的纹理效果。

对此,来自浙江大学ReLER实验室的研究人员提出SIFU模型,依靠侧视图条件隐函数从单张图片重建3D人体模型。

浙大提出新SOTA技術SIFU:只需一張圖片即可重建高品質3D人體模型图片

论文地址:https://arxiv.org/abs/2312.06704

项目地址:https://github.com/River-Zhang/SIFU

该模型通过在2D特征转换到3D空间引入人体侧视图作为先验条件,增强几何重建效果。并在纹理优化阶段引入预训练的扩散模型,来解决不可见区域纹理较差的问题。

模型结构

模型pipeline如下:

浙大提出新SOTA技術SIFU:只需一張圖片即可重建高品質3D人體模型图片

该模型运行可分为两个阶段,第一阶段借助侧隐式函数重建人体的几何(mesh)与粗糙的纹理(coarse texture),第二阶段则借助预训练的扩散模型对纹理进行精细化。

在第一阶段中,作者设计了一种独特的Side-view Decoupling Transformer,通过global encoder提取2D特征后,在decoder中引入了人体先验模型SMPL-X的侧视图作为query,从而在图像2D特征中解耦出人体不同方向的3D特征(前后左右),最后用于重建。

该方法成功的在2D特征转换到3D空间时结合人体先验知识,从而使得模型有更好的重建效果。

在第二阶段,作者提出一种3D一致性纹理优化流程(3D Consistent Texture Refinement),首先将人体不可见的区域(侧面、背面)可微渲染成视角连续的图片集,再借助在海量数据中学习到先验知识的扩散模型,对粗糙纹理图片进行一致性编辑,得到更精细的结果。最后通过精细化前后的图片计算损失来优化3D模型的纹理贴图。

实验部分

更高的重建精度

在实验部分,作者使用全面多样化的测试集对他们的模型进行测试,包括CAPE-NFP、CAPE-FP和THuman2.0,并与以往发表在各大顶会的单张图片人体重建SOTA模型进行比较。经定量测试,SIFU模型在几何重建与纹理重建中均表现出了最好的效果。

浙大提出新SOTA技術SIFU:只需一張圖片即可重建高品質3D人體模型定量評估幾何重建精確度

浙大提出新SOTA技術SIFU:只需一張圖片即可重建高品質3D人體模型定量評估紋理重建效果

 

浙大提出新SOTA技術SIFU:只需一張圖片即可重建高品質3D人體模型使用網路中公開圖片作為輸入進行定性效果展示

更強烈的穩健性

以往的模型在應用訓練集以外的資料時,由於估計的人體先驗模型SMPL/SMPL-X不夠準確,往往導致重建結果與輸入圖片相差甚遠,難以投入實際應用。

對此,作者專門對模型的穩健性進行了測試,透過在ground truth先驗模型參數中加入擾動使其位姿發生偏移,模擬真實場景中SMPL-X估計不準確的情況,來評估模型重建的精確度。結果顯示SIFU模型在該情況下,依然具有最佳的重建精度。

浙大提出新SOTA技術SIFU:只需一張圖片即可重建高品質3D人體模型評估模型面對有誤差的人體先驗模型時的穩健性

浙大提出新SOTA技術SIFU:只需一張圖片即可重建高品質3D人體模型#使用真實世界中的圖片,在先驗人體模型估計不準確的情況下,SIFU依然有較好的重建效果

更廣闊的應用場景

SIFU模型的高精度高品質重建效果,使得其具有豐富的應用場景,包括3D列印、場景建立、紋理編輯等。

浙大提出新SOTA技術SIFU:只需一張圖片即可重建高品質3D人體模型3D列印SIFU重建的人體模型

浙大提出新SOTA技術SIFU:只需一張圖片即可重建高品質3D人體模型

浙大提出新SOTA技術SIFU:只需一張圖片即可重建高品質3D人體模型

浙大提出新SOTA技術SIFU:只需一張圖片即可重建高品質3D人體模型

SIFU用於3D場景建立

浙大提出新SOTA技術SIFU:只需一張圖片即可重建高品質3D人體模型

##借助公開動作序列數據,可對SIFU重建的模型進行驅動

###總結#######本文提出側視圖條件隱式函數和3D一致性紋理編輯方法,彌補了以往工作在2D特徵轉換到3D空間、紋理預測時對先驗知識引入的不足,極大的提高了單張圖片人體重建的精度和效果,使模型在真實世界應用中具有顯著的優勢,也為該領域未來的研究提供了新的思路。 ############參考資料:######https://arxiv.org/abs/2312.06704###

以上是浙大提出新SOTA技術SIFU:只需一張圖片即可重建高品質3D人體模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
AI遊戲開發通過Upheaval的Dreamer Portal進入其代理時代AI遊戲開發通過Upheaval的Dreamer Portal進入其代理時代May 02, 2025 am 11:17 AM

動盪遊戲:與AI代理商的遊戲開發徹底改變 Roupheaval是一家遊戲開發工作室,由暴風雪和黑曜石等行業巨頭的退伍軍人組成,有望用其創新的AI驅動的Platfor革新遊戲創作

Uber想成為您的Robotaxi商店,提供商會讓他們嗎?Uber想成為您的Robotaxi商店,提供商會讓他們嗎?May 02, 2025 am 11:16 AM

Uber的Robotaxi策略:自動駕駛汽車的騎車生態系統 在最近的Curbivore會議上,Uber的Richard Willder推出了他們成為Robotaxi提供商的乘車平台的策略。 利用他們在

AI代理玩電子遊戲將改變未來的機器人AI代理玩電子遊戲將改變未來的機器人May 02, 2025 am 11:15 AM

事實證明,視頻遊戲是最先進的AI研究的寶貴測試理由,尤其是在自主代理商和現實世界機器人的開發中,甚至有可能促進人工通用情報(AGI)的追求。 一個

創業公司工業綜合體VC 3.0和James Currier的宣言創業公司工業綜合體VC 3.0和James Currier的宣言May 02, 2025 am 11:14 AM

不斷發展的風險投資格局的影響在媒體,財務報告和日常對話中顯而易見。 但是,對投資者,初創企業和資金的具體後果經常被忽略。 風險資本3.0:範式

Adobe在Adobe Max London 2025更新創意云和螢火蟲Adobe在Adobe Max London 2025更新創意云和螢火蟲May 02, 2025 am 11:13 AM

Adobe Max London 2025對Creative Cloud和Firefly進行了重大更新,反映了向可訪問性和生成AI的戰略轉變。 該分析結合了事件前簡報中的見解,並融合了Adobe Leadership。 (注意:Adob

Llamacon宣布的所有元數據Llamacon宣布的所有元數據May 02, 2025 am 11:12 AM

Meta的Llamacon公告展示了一項綜合的AI策略,旨在直接與OpenAI等封閉的AI系統競爭,同時為其開源模型創建了新的收入流。 這個多方面的方法目標bo

關於AI僅僅是普通技術的主張的釀造爭議關於AI僅僅是普通技術的主張的釀造爭議May 02, 2025 am 11:10 AM

人工智能領域對這一論斷存在嚴重分歧。一些人堅稱,是時候揭露“皇帝的新衣”了,而另一些人則強烈反對人工智能僅僅是普通技術的觀點。 讓我們來探討一下。 對這一創新性人工智能突破的分析,是我持續撰寫的福布斯專欄文章的一部分,該專欄涵蓋人工智能領域的最新進展,包括識別和解釋各種有影響力的人工智能複雜性(請點擊此處查看鏈接)。 人工智能作為普通技術 首先,需要一些基本知識來為這場重要的討論奠定基礎。 目前有大量的研究致力於進一步發展人工智能。總目標是實現人工通用智能(AGI)甚至可能實現人工超級智能(AS

模型公民,為什麼AI值是下一個業務碼模型公民,為什麼AI值是下一個業務碼May 02, 2025 am 11:09 AM

公司AI模型的有效性現在是一個關鍵的性能指標。自AI BOOM以來,從編寫生日邀請到編寫軟件代碼的所有事物都將生成AI使用。 這導致了語言mod的擴散

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強大的PHP整合開發環境

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器