五分鐘生成漫威3D數字人！美隊蜘蛛人小丑都能搞定，高清還原臉部細節-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

五分鐘生成漫威3D數字人！美隊蜘蛛人小丑都能搞定，高清還原臉部細節

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 05, 2023 pm 10:40 PM

3d數位人

隨著電腦圖形學的發展，3D生成技術正逐漸成為研究熱點。然而，從文字或圖像生成3D模型仍然存在許多挑戰。

近期，Google、NVIDIA和微軟等公司推出了基於神經輻射場（NeRF）的3D生成方法，但這些方法與傳統的3D渲染軟體（如Unity、Unreal Engine和Maya等）存在相容性問題，限制了其在實際應用上的廣泛應用。

為此，影眼科技與上海科技大學的研發團隊提出了一種文字指導的漸進式3D生成框架，旨在解決這些問題。

根據文字描述產生3D資產

該研究團隊提出的文本指導的漸進式3D生成框架（簡稱DreamFace），結合了視覺-語言模型、隱式擴散模型和基於物理的材質擴散技術，產生符合電腦圖形製作標準的3D資產。

這個框架的創新之處在於其幾何體生成、基於物理的材質擴散生成和動畫能力生成三個模組。

這項工作已被頂級期刊Transactions on Graphics接收，並將在國際電腦圖形學頂級會議SIGGRAPH 2023上展示。

五分鐘生成漫威3D數字人！美隊蜘蛛人小丑都能搞定，高清還原臉部細節

計畫網站：https://sites.google.com/view/dreamface
#預印版論文：https://arxiv.org/abs/2304.03117
Web Demo: https://hyperhuman.top
HuggingFace Space:https ://huggingface.co/spaces/DEEMOSTECH/ChatAvatar

如何實現DreamFace三大功能

DreamFace主要包括三個模組，幾何體生成，基於物理的材質擴散和動畫能力生成。相較於先前的3D生成工作，這項工作的主要貢獻包括：

提出了DreamFace這一新穎的生成方案，將最近的視覺-語言模型與可動畫和物理材質的面部資產結合，透過漸進式學習來分離幾何、外觀和動畫能力。
引入了雙通道外觀生成的設計，將一種新穎的材質擴散模型與預訓練模型相結合，同時在潛在空間和圖像空間進行兩階段優化。
使用BlendShapes或產生的Personalized BlendShapes的臉部資產具備動畫能力，並進一步展示了DreamFace在自然人物設計方面的應用。

幾何體產生：此模組透過CLIP（Contrastive Language-Image Pre-Training）選擇框架根據文字提示產生幾何模型。

首先從人臉幾何參數空間隨機取樣候選項，然後根據文字提示選擇匹配得分最高的粗略幾何模型。

接下來，使用隱式擴散模型（LDM）和得分蒸餾採樣（SDS）處理，從而在粗略幾何模型中添加面部細節和詳細的法線貼圖，生成高精度幾何體。

五分鐘生成漫威3D數字人！美隊蜘蛛人小丑都能搞定，高清還原臉部細節

#基於物理的材質擴散產生：此模組針對預測幾何體和文本提示生成臉部紋理。首先，對LDM進行微調，得到兩個擴散模型。

然後，透過聯合訓練方案協調這兩個模型，一個用於直接去噪U紋理貼圖，另一個用於監督渲染影像。此外，還採用了提示學習策略和非臉部區域遮罩以確保產生的漫反射貼圖的品質。

最後，應用超解析度模組產生4K基於物理的紋理，以進行高品質渲染。

五分鐘生成漫威3D數字人！美隊蜘蛛人小丑都能搞定，高清還原臉部細節

#動畫能力產生：DreamFace產生的模型具備動畫能力。與傳統基於BlendShapes的方法不同，該框架透過預測獨特的變形為靜止（Neutral）模型賦予動畫效果，從而產生個性化的動畫。

先訓練幾何生成器學習表情潛在空間，然後訓練表情編碼器從RGB影像中擷取表情特徵。最終，透過使用單眼RGB影像生成個人化的動畫。

5分鐘產生指定3D資產

DreamFace框架在名人生成、描述生成角色等任務上取得了良好的效果，並在使用者評估中獲得了超過先前工作的成績。

五分鐘生成漫威3D數字人！美隊蜘蛛人小丑都能搞定，高清還原臉部細節

同時，與現有方法相比，運行時間上具有明顯優勢。

五分鐘生成漫威3D數字人！美隊蜘蛛人小丑都能搞定，高清還原臉部細節

此外，DreamFace支援使用提示和草圖進行紋理編輯，實現全局編輯效果（如老化、化妝）和局部編輯效果（如紋身、鬍鬚、胎記）。

五分鐘生成漫威3D數字人！美隊蜘蛛人小丑都能搞定，高清還原臉部細節

可用於影視、遊戲等產業

作為一種文字指導的漸進式3D生成框架，DreamFace結合了視覺-語言模型、隱式擴散模型和基於物理的材質擴散技術，實現了高精度、高效率和良好相容性的3D生成。

此框架為解決複雜的3D生成任務提供了有效解決方案，並有望推動更多類似的研究和技術發展。

此外，基於物理的材質擴散生成和動畫能力生成將推動 3D生成技術在影視製作、遊戲開發和其他相關行業的應用。

以上是五分鐘生成漫威3D數字人！美隊蜘蛛人小丑都能搞定，高清還原臉部細節的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：51CTO.COM。如有侵權，請聯絡admin@php.cn刪除

AI內部部署的隱藏危險：治理差距和災難性風險Apr 28, 2025 am 11:12 AM

Apollo Research的一份新報告顯示，先進的AI系統的不受檢查的內部部署構成了重大風險。在大型人工智能公司中缺乏監督，普遍存在，允許潛在的災難性結果

構建AI測謊儀Apr 28, 2025 am 11:11 AM

傳統測謊儀已經過時了。依靠腕帶連接的指針，打印出受試者生命體徵和身體反應的測謊儀，在識破謊言方面並不精確。這就是為什麼測謊結果通常不被法庭採納的原因，儘管它曾導致許多無辜者入獄。相比之下，人工智能是一個強大的數據引擎，其工作原理是全方位觀察。這意味著科學家可以通過多種途徑將人工智能應用於尋求真相的應用中。一種方法是像測謊儀一樣分析被審問者的生命體徵反應，但採用更詳細、更精確的比較分析。另一種方法是利用語言標記來分析人們實際所說的話，並運用邏輯和推理。俗話說，一個謊言會滋生另一個謊言，最終

AI是否已清除航空航天行業的起飛？Apr 28, 2025 am 11:10 AM

航空航天業是創新的先驅，它利用AI應對其最複雜的挑戰。現代航空的越來越複雜性需要AI的自動化和實時智能功能，以提高安全性，降低操作

觀看北京的春季機器人比賽Apr 28, 2025 am 11:09 AM

機器人技術的飛速發展為我們帶來了一個引人入勝的案例研究。來自Noetix的N2機器人重達40多磅，身高3英尺，據說可以後空翻。 Unitree公司推出的G1機器人重量約為N2的兩倍，身高約4英尺。比賽中還有許多體型更小的類人機器人參賽，甚至還有一款由風扇驅動前進的機器人。數據解讀這場半程馬拉松吸引了超過12,000名觀眾，但只有21台類人機器人參賽。儘管政府指出參賽機器人賽前進行了“強化訓練”，但並非所有機器人均完成了全程比賽。冠軍——由北京類人機器人創新中心研發的Tiangong Ult

鏡子陷阱：人工智能倫理和人類想像力的崩潰Apr 28, 2025 am 11:08 AM

人工智能以目前的形式並不是真正智能的。它擅長模仿和完善現有數據。我們不是在創造人工智能，而是人工推斷 - 處理信息的機器，而人類則

新的Google洩漏揭示了方便的Google照片功能更新Apr 28, 2025 am 11:07 AM

一份報告發現，在谷歌相冊Android版7.26版本的代碼中隱藏了一個更新的界面，每次查看照片時，都會在屏幕底部顯示一行新檢測到的面孔縮略圖。新的面部縮略圖缺少姓名標籤，所以我懷疑您需要單獨點擊它們才能查看有關每個檢測到的人員的更多信息。就目前而言，此功能除了谷歌相冊已在您的圖像中找到這些人之外，不提供任何其他信息。此功能尚未上線，因此我們不知道谷歌將如何準確地使用它。谷歌可以使用縮略圖來加快查找所選人員的更多照片的速度，或者可能用於其他目的，例如選擇要編輯的個人。我們拭目以待。就目前而言