只需2張圖片,無需測量任何額外數據-
當當,一個完整的3D小熊就有了:
這個名為DUSt3R的新工具,火得一塌糊塗,才上線沒多久就登上GitHub熱榜第二。
有網友實測#,拍兩張照片,真的就重建出了他家的廚房,整個過程耗時不到2秒鐘!
(除了3D圖,深度圖、置信度圖和點雲圖它都能一併給出)
驚得這位朋友直呼:
大夥先忘掉sora吧,這才是我們真正看得見摸得著的東西。
實驗顯示,DUSt3R在單目/多視圖深度估計以及相對位姿估計三個任務上,均取得SOTA。
作者團隊(來自芬蘭阿爾託大學NAVER LABS人工智慧研究所歐洲分所)的「宣語」也是氣勢滿滿:
我們就是要讓天下沒有難搞的3D視覺任務。
所以,它是如何做到?
「all-in-one」
對於多視圖立體重建(MVS)任務來說,第一步就是估計相機參數,包括內外參。
這個操作很枯燥也很麻煩,但對於後續在三維空間中進行三角測量的像素不可或缺,而這又是幾乎所有效能比較好的MVS演算法都離不開的一環。
在本文研究中,作者團隊引進的DUSt3R則完全採用了截然不同的方法。
它不需要任何相機校準或視點姿勢的先驗資訊,就可完成任意影像的密集或無約束3D重建。
在此,團隊將成對重建問題表述為點圖迴歸,統一單目和雙眼重建情況。
在提供超過兩張輸入影像的情況下,透過簡單而有效的全域對準策略,將所有成對的點圖表示為一個共同的參考框架。
如下圖所示,給定一組具有未知相機姿態和內在特徵的照片,DUSt3R輸出對應的一組點圖,從中我們就可以直接恢復各種通常難以同時估計的幾何量,如相機參數、像素對應關係、深度圖,以及完全一致的3D重建效果。
(作者提示,DUSt3R也適用於單張輸入影像)
具體網路架構方面,DUSt3R基於的是標準Transformer編碼器和解碼器,受到了CroCo(透過跨視圖完成3D視覺任務的自我監督預訓練的一個研究)的啟發,並採用簡單的回歸損失訓練完成。
如下圖所示,場景的兩個視圖(I1,I2)首先以共享的ViT編碼器以連體(Siamese)方式進行編碼。
所得到的token表示(F1和F2)隨後被傳遞到兩個Transformer解碼器,後者透過交叉注意力不斷地交換資訊。
最後,兩個迴歸頭輸出兩個對應的點圖和相關的置信圖。
重點是,這兩個點圖都要在第一張影像的同一座標系中進行表示。
Multi-tasks SOTA
The experiment first evaluates DUST3R on the 7Scenes (7 indoor scenes) and Cambridge Landmarks (8 outdoor scenes) datasets Performance on the absolute pose estimation task, the indicators are translation error and rotation error (the smaller the value, the better) .
The author stated that compared with other existing feature matching and end-to-end methods, the performance of DUSt3R is remarkable.
Because it has never received any visual positioning training, and secondly, it has not encountered query images and database images during the training process.
Secondly, is the multi-view pose regression task performed on 10 random frames. Results DUST3R achieved the best results on both datasets.
On the monocular depth estimation task, DUSt3R can also hold indoor and outdoor scenes well, with performance better than that of self-supervised baselines and different from the most advanced supervised baselines. Up and down.
In terms of multi-view depth estimation, DUSt3R’s performance is also outstanding.
The following are the 3D reconstruction effects given by the two groups of officials. To give you a feel, they only input two images:
(1)
(2)
Actual measurement by netizens: It’s OK if the two pictures don’t overlap
Yes A netizen gave DUST3R two images without any overlapping content, and it also output an accurate 3D view within a few seconds:
(The picture is his office, so I must have never seen it in training)
In response, some netizens said that this means that the method is not there Make "objective measurements" and instead behave more like an AI.
In addition, some people are curiousWhether the method is still valid when the input images are taken by two different cameras?
Some netizens actually tried it, and the answer is yes!
Portal:
[1]Paper https://arxiv.org/abs/2312.14132
[2]Code https ://github.com/naver/dust3r
以上是兩張圖2秒鐘3D重建!這款AI工具火爆GitHub,網友:忘掉Sora的詳細內容。更多資訊請關注PHP中文網其他相關文章!

對於那些可能是我專欄新手的人,我廣泛探討了AI的最新進展,包括體現AI,AI推理,AI中的高科技突破,及時的工程,AI培訓,AI,AI RE RE等主題

歐洲雄心勃勃的AI大陸行動計劃旨在將歐盟確立為人工智能的全球領導者。 一個關鍵要素是建立了AI Gigafactories網絡,每個網絡都有大約100,000個高級AI芯片 - 2倍的自動化合物的四倍

微軟對AI代理申請的統一方法:企業的明顯勝利 微軟最近公告的新AI代理能力清晰而統一的演講給人留下了深刻的印象。 與許多技術公告陷入困境不同

Shopify首席執行官TobiLütke最近的備忘錄大膽地宣布AI對每位員工的基本期望是公司內部的重大文化轉變。 這不是短暫的趨勢。這是整合到P中的新操作範式

IBM的Z17大型機:集成AI用於增強業務運營 上個月,在IBM的紐約總部,我收到了Z17功能的預覽。 以Z16的成功為基礎(於2022年推出並證明持續的收入增長

解鎖不可動搖的信心,消除了對外部驗證的需求! 這五個CHATGPT提示將指導您完全自力更生和自我感知的變革轉變。 只需複制,粘貼和自定義包圍

人工智能安全與研究公司 Anthropic 最近的一項[研究]開始揭示這些複雜過程的真相,展現出一種令人不安地與我們自身認知領域相似的複雜性。自然智能和人工智能可能比我們想像的更相似。 窺探內部:Anthropic 可解釋性研究 Anthropic 進行的研究的新發現代表了機制可解釋性領域的重大進展,該領域旨在反向工程 AI 的內部計算——不僅僅觀察 AI 做了什麼,而是理解它在人工神經元層面如何做到這一點。 想像一下,試圖通過繪製當有人看到特定物體或思考特定想法時哪些神經元會放電來理解大腦。 A

高通的龍翼:企業和基礎設施的戰略飛躍 高通公司通過其新的Dragonwing品牌在全球範圍內積極擴展其範圍,以全球為目標。 這不僅僅是雷布蘭


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

SublimeText3 英文版
推薦:為Win版本,支援程式碼提示!

Dreamweaver CS6
視覺化網頁開發工具