搜尋
首頁科技週邊人工智慧眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

「唯一真正的探索之旅,不是去拜訪陌生的土地,而是透過別人的眼睛來觀察宇宙。」——馬塞爾·普魯斯特

透過別人的眼睛看世界,這個又科幻又詩意(又恐怖)的想法,已經成真了!

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

《黑鏡》第一季《你的全部歷史》

#現在,我們只要利用眼睛的反光,就能立體重建這個人正在觀察的物體。

是的,這很黑鏡。


眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷


眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

最近,來自馬裡蘭大學的團隊,提出一種全新的方法——透過利用包含眼睛反射的人像,來對攝影機沒有拍到的場景進行三維重建。

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

論文網址:https://arxiv.org/abs/2306.09348

#專案網址:https://world-from-eyes.github.io/

經典科幻中的場景都成真了?

用眼睛反射產生輻射場重建?這個想法看似瘋狂,但其實有足夠的理論基礎。

作者介紹說,因為人眼具有高度的反射性,所以從捕捉頭部移動的一系列影格中,完全可以做到僅使用眼睛的反射,就能重建和渲染人們正在觀察的3D場景。

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

鑑於這個概念非常「黑鏡」,而且這篇論文一發布沒幾個小時,《黑鏡》新一季就宣布上線了,這種巧合簡直讓人懷疑《黑鏡》的導演是不是也注意到了這篇論文。 (狗頭)

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

#黑鏡第六季今日上線

#這項研究一出,網友們直接炸了。

所以,我們已經快轉到這一步了?

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

這不就是2000年代《攻殼機動隊》中的場景嗎?這些虛構全都變成現實了! 眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

###100%的《銀翼殺手》,現在就給我一份拷貝吧。 ######

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

#儒勒凡爾納的《基普兄弟》成真了!

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

當然,也有人對此表示毛骨悚然:這個技術可千萬別被用來調查取證之類的事情。

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

而在今天,我們已經有了Varjo眼動追蹤相機,還有蘋果的VisionPro以及其他頭顯,這些設備都可以捕捉大量鏡頭素材,結合進這項新技術,無數嶄新的科幻場景,恐怕馬上都要成真了……

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

透過利用光線在人眼上的微小反射,研究團隊開發了一種方法,可以使用在固定相機位置拍攝的單眼影像序列來重建人所觀察到的(非直視)場景。

不過,僅僅在觀察到的反射上訓練輻射場是不夠的,原因有幾個:1)角膜定位中的固有噪聲,2)虹膜紋理的複雜性, 3)每張影像中捕捉的低解析度反射。

為了解決這些挑戰,團隊在訓練過程中引入了角膜姿態優化和虹膜紋理分解,並藉助基於人眼虹膜的徑向紋理正則化損失。

與傳統的需要移動相機的神經場訓練方法不同,他們使用的方法將相機放置在固定的視點上,完全依賴使用者的移動。

利用人眼反光,實現場景重建

由於準確估計眼睛的姿態十分困難,再加上虹膜和場景反射之間的紋理相互交織,因此這項任務頗具挑戰性。

為了解決這個問題,作者針對眼睛姿態、描述場景的輻射場以及觀察者的眼睛虹膜紋理,進行了聯合優化。

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

具體來說,主要的貢獻有三點:

1. 新的三維重建

提出了一種從眼睛圖像中重建觀察者世界的3D場景的新方法,可以將先前的基礎工作與神經渲染的最新進展相結合。

2. 虹膜的徑向先驗

#引入了虹膜紋理分解的徑向先驗,顯著提高了重建的輻射場的質量。

3. 角膜姿態的最佳化

#發展了一種角膜姿態優化的過程,以減輕眼睛姿態估計的噪聲,克服了從人眼中提取特徵的獨特挑戰。

結果顯示,利用這個全新的方法,我們可以透過移動畫面,從眼睛的反射中獲得場景的多個視角,最終實現完整的場景重建。

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

更厲害的是,團隊也試著利用Miley Cyrus和Lady Gaga的MV,來重建她們眼睛裡的景象。

作者表示,他們成功地重建了出現在Miley的眼中的物體,並且從Lady Gaga的眼中似乎看到了一個人的上半身。

然而,由於這些影片的品質不夠高,因此還不能斷定重建結果的準確性。

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

#Lady Gaga

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

Lady Gaga

Miley Cyrus

如何做到的?

眾所周知,健康成年人的角膜幾何形狀幾乎相同。

因此,只需在圖像中計算一個人的角膜的像素大小,就可以準確計算出他們的眼睛位置。

接下來,作者透過從相機拍攝光線,並將它們反射出近似的眼睛幾何形狀,來訓練眼睛反射的輻射場。

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

為了避免人眼的虹膜在重建中出現,作者同時訓練了一個學習虹膜紋理的二維紋理映射,來進行紋理分解。


眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷


眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷


眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

實驗評估

##實驗評估

合成資料評估

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

首先,作者透過在Blender場景中放置人眼模型,進行了合成資料上的評估。

下圖展示了僅利用眼睛反射重建的場景。

由於在現實生活中無法完美估計眼角膜,作者和評估了角膜姿態優化對估計角膜半徑噪音的穩健性。

#########為了模擬真實數據中可能遇到的深度估計誤差,作者透過使用不同噪音水平對每個圖像中觀察到的角膜半徑進行縮放,來破壞觀察到的角膜半徑r_img。 ###########################下圖展示了在不同雜訊等級下的效能變化。 ############值得注意的是,隨著噪音的增加,與無姿態優化的重建相比,作者提出的姿態優化重建在重建的幾何形狀和顏色方面更為穩健。 ######

這證明姿態優化對於現實場景至關重要,因為影像中從投影的角膜到初始橢圓擬合並不完美。

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

此外,有無紋理分解的情況下的定量比較顯示,作者的方法在SSIM和LPIPS方面在紋理分解的情況下表現得更好。

值得注意的是,作者沒有計算PSNR,因為在設定中,反射和場景本身之間的照明差異非常大。

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

真實世界評估

為了保證視野的真實,作者選擇了索尼RX IV相機進行拍攝,並使用Adobe Lightroom對影像進行後處理,以減少角膜反射中的雜訊。同時,作者在人物的兩側加入了光源來照亮目標物體。

過程中,被拍的人需要在相機的視野範圍內移動,以便團隊在每個場景中拍攝5-15張影像。

由於場景照明具有較大的動態範圍,作者在所有實驗中使用16位元影像,以避免遺失觀察到的反射中的信息。

平均而言,每個影像中角膜只覆蓋約0.1%的區域,而目標物體大約會佔到20x20像素,並與虹膜紋理交錯。

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

作者先透過對影像進行角膜中心和半徑的估計,以獲得角膜的初始位置估計。 然後,使用平均深度和相機的焦距直接近似來計算角膜的三維位置,並計算其表面法線。

為了自動化這個過程,作者使用Grounding Dino定位眼睛的邊界框,並使用ELLSeg對虹膜進行橢圓擬合。

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷儘管角膜通常被遮擋,但我們只需要未遮蔽的區域,因此可以使用Segment Anything來獲得虹膜的分割掩碼。

真實結果

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

從下圖在展示的效果中可以看出,作者的方法能夠從真實世界的人像圖片中重建3D場景,儘管存在角膜位置和幾何估計的不準確性。

###由於角膜邊界的模糊性,想要在影像中實現精確的定位十分困難。 ############此外,對於某些眼睛顏色,如綠色和藍色,3D重建也會更加困難,因為虹膜紋理較亮。 ###########################此外,當沒有明確建模紋理時,重建後的畫面中還會出現更多的「漂浮物」。 ############為了解決這些問題,可以透過增加徑向正規化的程度,來改善重建的品質。 ######

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

不過,這個方法依然有兩個主要的限制。

首先,目前的真實世界結果是基於「實驗室設定」,例如對人臉進行放大拍攝、使用額外的光源照亮場景等。而在較自由的環境中,就需要面對感測器解析度較低、動態範圍較小且存在運動模糊等更大的挑戰。

其次,目前對虹膜紋理的假設(例如恆定紋理、徑向恆定顏色)可能過於簡化,因此該方法在眼睛大幅度旋轉時可能會失效。

作者介紹

共同一作Kevin Zhang,目前是馬裡蘭大學的博士生。

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

Brandon Y. Feng在馬裡蘭大學獲得電腦科學博士學位,研究興趣集中在計算成像、中層視覺和計算攝影領域。曾開發了用於影像和3D資料處理的機器學習演算法,應用範圍涵蓋混合實境到自然科學等領域。

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

Jia-Bin Huang是馬裡蘭大學副教授,先前在UIUC獲得了博士學位。研究興趣集中在電腦視覺、電腦圖形學和機器學習的交叉領域。

眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷

以上是眼球反射解鎖3D世界,黑鏡成真!馬裡蘭華人新作炸翻科幻迷的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
为何在自动驾驶方面Gaussian Splatting如此受欢迎,开始放弃NeRF?为何在自动驾驶方面Gaussian Splatting如此受欢迎,开始放弃NeRF?Jan 17, 2024 pm 02:57 PM

写在前面&笔者的个人理解三维Gaussiansplatting(3DGS)是近年来在显式辐射场和计算机图形学领域出现的一种变革性技术。这种创新方法的特点是使用了数百万个3D高斯,这与神经辐射场(NeRF)方法有很大的不同,后者主要使用隐式的基于坐标的模型将空间坐标映射到像素值。3DGS凭借其明确的场景表示和可微分的渲染算法,不仅保证了实时渲染能力,而且引入了前所未有的控制和场景编辑水平。这将3DGS定位为下一代3D重建和表示的潜在游戏规则改变者。为此我们首次系统地概述了3DGS领域的最新发展和关

了解 Microsoft Teams 中的 3D Fluent 表情符号了解 Microsoft Teams 中的 3D Fluent 表情符号Apr 24, 2023 pm 10:28 PM

您一定记得,尤其是如果您是Teams用户,Microsoft在其以工作为重点的视频会议应用程序中添加了一批新的3DFluent表情符号。在微软去年宣布为Teams和Windows提供3D表情符号之后,该过程实际上已经为该平台更新了1800多个现有表情符号。这个宏伟的想法和为Teams推出的3DFluent表情符号更新首先是通过官方博客文章进行宣传的。最新的Teams更新为应用程序带来了FluentEmojis微软表示,更新后的1800表情符号将为我们每天

选择相机还是激光雷达?实现鲁棒的三维目标检测的最新综述选择相机还是激光雷达?实现鲁棒的三维目标检测的最新综述Jan 26, 2024 am 11:18 AM

0.写在前面&&个人理解自动驾驶系统依赖于先进的感知、决策和控制技术,通过使用各种传感器(如相机、激光雷达、雷达等)来感知周围环境,并利用算法和模型进行实时分析和决策。这使得车辆能够识别道路标志、检测和跟踪其他车辆、预测行人行为等,从而安全地操作和适应复杂的交通环境.这项技术目前引起了广泛的关注,并认为是未来交通领域的重要发展领域之一。但是,让自动驾驶变得困难的是弄清楚如何让汽车了解周围发生的事情。这需要自动驾驶系统中的三维物体检测算法可以准确地感知和描述周围环境中的物体,包括它们的位置、

Windows 11中的Paint 3D:下载、安装和使用指南Windows 11中的Paint 3D:下载、安装和使用指南Apr 26, 2023 am 11:28 AM

当八卦开始传播新的Windows11正在开发中时,每个微软用户都对新操作系统的外观以及它将带来什么感到好奇。经过猜测,Windows11就在这里。操作系统带有新的设计和功能更改。除了一些添加之外,它还带有功能弃用和删除。Windows11中不存在的功能之一是Paint3D。虽然它仍然提供经典的Paint,它对抽屉,涂鸦者和涂鸦者有好处,但它放弃了Paint3D,它提供了额外的功能,非常适合3D创作者。如果您正在寻找一些额外的功能,我们建议AutodeskMaya作为最好的3D设计软件。如

单卡30秒跑出虚拟3D老婆!Text to 3D生成看清毛孔细节的高精度数字人,无缝衔接Maya、Unity等制作工具单卡30秒跑出虚拟3D老婆!Text to 3D生成看清毛孔细节的高精度数字人,无缝衔接Maya、Unity等制作工具May 23, 2023 pm 02:34 PM

ChatGPT给AI行业注入一剂鸡血,一切曾经的不敢想,都成为如今的基操。正持续进击的Text-to-3D,就被视为继Diffusion(图像)和GPT(文字)后,AIGC领域的下一个前沿热点,得到了前所未有的关注度。这不,一款名为ChatAvatar的产品低调公测,火速收揽超70万浏览与关注,并登上抱抱脸周热门(Spacesoftheweek)。△ChatAvatar也将支持从AI生成的单视角/多视角原画生成3D风格化角色的Imageto3D技术,受到了广泛关注现行beta版本生成的3D模型,

自动驾驶3D视觉感知算法深度解读自动驾驶3D视觉感知算法深度解读Jun 02, 2023 pm 03:42 PM

对于自动驾驶应用来说,最终还是需要对3D场景进行感知。道理很简单,车辆不能靠着一张图像上得到感知结果来行驶,就算是人类司机也不能对着一张图像来开车。因为物体的距离和场景的和深度信息在2D感知结果上是体现不出来的,而这些信息才是自动驾驶系统对周围环境作出正确判断的关键。一般来说,自动驾驶车辆的视觉传感器(比如摄像头)安装在车身上方或者车内后视镜上。无论哪个位置,摄像头所得到的都是真实世界在透视视图(PerspectiveView)下的投影(世界坐标系到图像坐标系)。这种视图与人类的视觉系统很类似,

《原神》:知名原神3d同人作者被捕《原神》:知名原神3d同人作者被捕Feb 15, 2024 am 09:51 AM

一些原神“奇怪”的关键词,在这两天很有关注度,明明搜索指数没啥变化,却不断有热议话题蹦窜。例如了龙王、钟离等“转变”立绘激增,虽在网络上疯传了一阵子,但是经过追溯发现这些是合理、常规的二创同人。如果单是这些,倒也翻不起多大的热度。按照一部分网友的说法,除了原神自身就有热度外,发现了一件格外醒目的事情:原神3d同人作者shirakami已经被捕。这引发了不小的热议。为什么被捕?关键词,原神3D动画。还是越过了线(就是你想的那种),再多就不能明说了。经过多方求证,以及新闻报道,确实有此事。自从去年发

跨模态占据性知识的学习:使用渲染辅助蒸馏技术的RadOcc跨模态占据性知识的学习:使用渲染辅助蒸馏技术的RadOccJan 25, 2024 am 11:36 AM

原标题:Radocc:LearningCross-ModalityOccupancyKnowledgethroughRenderingAssistedDistillation论文链接:https://arxiv.org/pdf/2312.11829.pdf作者单位:FNii,CUHK-ShenzhenSSE,CUHK-Shenzhen华为诺亚方舟实验室会议:AAAI2024论文思路:3D占用预测是一项新兴任务,旨在使用多视图图像估计3D场景的占用状态和语义。然而,由于缺乏几何先验,基于图像的场景

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
2 週前By尊渡假赌尊渡假赌尊渡假赌
倉庫:如何復興隊友
4 週前By尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒險:如何獲得巨型種子
4 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強大的PHP整合開發環境