IT之家 6 月 2 日消息,英偉達公司於本周宣布推出一款名為 Neuralangelo 的 AI 模型,能夠將影片片段轉化為細節層次豐富、具備貼圖的 3D 模型。
▲ 圖源 英偉達
IT之家查詢得知,先前也已經有數個基於影片內容產生 3D 模型的 AI,但這些 AI 往往在面對低對比度影片時便無法著手。而英偉達的Neuralangelo 模型採用了即時神經繪圖(instant neural graphics primitives),並利用了自家的Instant NeRF 技術,因此即使是對於低對比度的視頻,也可以從中捕捉到微妙的細節,並轉換為更具備商業價值的3D 模型。
▲ 圖源 英偉達
英偉達強調,Neuralangelo 的獨到之處主要表現在其「準確性」與「普適性」:
▲ 圖源 英偉達
Neuralangelo 模型利用從不同角度拍攝的物品的影片作為輸入素材,來產生創作者所需的模型。一旦 Neuralangelo 確定了影片中相機的運動規律,它就會產生模型的 3D 輪廓,並開始在上面雕刻出細節。
▲ 圖源 英偉達
預計英偉達將在 6 月 18 日至 22 日舉行的電腦視覺與樣式辨識(Computer Vision and Pattern Recognition,CVPR)大會上發布 Neuralangelo 模型。在內部展示中,英偉達展示了 Neuralangelo 模型重建的米開朗基羅著名雕刻作品《大衛》、英偉達位於灣區的辦公室、及平板拖車等日常見到的物品的 3D 還原模型。
▲ 圖源 英偉達
英偉達在會議上展示的模型除了 Neuralangelo,還包括名為DiffCollage的模型。 DiffCollage 是一種能夠透過文字提示詞產生影片的 AI 模型,可產生 360 度全景影像與循環動態影像,並再將這些影像擴展為具體的影片。
英偉達研究部資深主任、論文作者 Ming-Yu Liu 對這項研究的意義給出了暢想:
Neuralangelo 提供的 3D 重建能力將為創作者帶來巨大好處,幫助他們在數位世界中重建真實世界。這個工具最終將使開發人員能夠將精細的物體 —— 不論是小型雕像,還是大型建築 —— 導入電玩遊戲或工業數位孿生的虛擬環境中。
IT之家的朋友們可以在這裡找到論文的具體內容。
以上是英偉達公佈 Neuralangelo AI模型,可將影片內容轉換為高精3D模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!