神經輻射場(NeRF)已經成為一種流行的新視圖合成方法。雖然 NeRF 正在快速泛化到更廣泛的應用以及資料集中,但直接編輯 NeRF 的建模場景仍然是一個巨大的挑戰。一個重要的任務是從 3D 場景中刪除不需要的對象,並與其周圍場景保持一致性,這個任務稱為 3D 影像修復。在 3D 中,解決方案必須在多個視圖中保持一致,並且在幾何上具有有效性。
本文來自三星、多倫多大學等機構的研究人員提出了一種新的三維修復方法來解決這些挑戰,在單一輸入影像中給定一小組姿態影像和稀疏註釋,提出的模型框架首先快速獲得目標對象的三維分割掩碼並使用該掩碼,然後引入一種基於感知優化的方法,該方法利用學習到的二維圖像再進行修復,將他們的信息提取到三維空間,同時確保視圖的一致性。
研究也透過訓練一個很有挑戰性的現實場景的資料集,為評估三維場景內修復方法帶來了新的基準測試。特別是,該資料集包含了有或沒有目標物件的相同場景的視圖,從而使三維空間內修復任務能夠進行更有原則的基準測試。
- #論文網址:https://arxiv.org/pdf/2211.12254.pdf
- 論文首頁:https://spinnerf3d.github.io/
下面為效果展示,移除一些物件後,還能與周圍場景保持一致性:
#本文方法和其他方法的比較,其他方法存在明顯的偽影,而本文的方法不是很明顯:
#方法介紹
作者透過一個整合的方法來應對三維場景編輯任務中的各種挑戰,該方法獲取場景的多視圖圖像,以用戶輸入提取到的3D 掩碼,並用NeRF 訓練來擬合到掩碼圖像中,這樣目標對象就被合理的三維外觀和幾何形狀取代。現有的互動式二維分割方法沒有考慮三維方面的問題,而且目前基於 NeRF 的方法不能使用稀疏註釋得到好的結果,也沒有達到足夠的精度。雖然目前一些基於 NeRF 的演算法允許去除物體,但它們並不試圖提供新生成的空間部分。根據目前的研究進展,這項工作是第一個在單一框架中同時處理互動式多視圖分割和完整的三維圖像修復的方法。
研究者利用現成的、無 3D 的模型進行分割和影像修復,並以視圖一致性的方式將其輸出轉移到 3D 空間。建立在 2D 互動式分割工作的基礎上,作者所提出的模型從一個目標物件上的少量使用者用滑鼠標定的圖像點開始。由此,他們的演算法用一個基於視訊的模型初始化掩碼,並透過擬合一個語義掩碼的 NeRF ,將其訓練成一個連貫的 3D 分割。然後,再應用預先訓練的二維影像修復到多視圖影像集上,NeRF 擬合過程用於重建三維影像場景,利用感知損失去約束2 維畫影像的不一致,以及畫深度影像規範化遮罩的幾何區域。總的來說,研究者提供了一個完整的方法,從物件選擇到嵌入的場景的新視圖合成,在一個統一的框架中對使用者的負擔最小,如下圖所示。
綜上所述,這篇工作的貢獻如下:
- 一個完整的3D 場景操作過程,從使用者互動的物件選擇開始,到3D 修復的NeRF 場景結束;
- 將二維的分割模型擴展到多視圖情況,能夠從稀疏註釋中恢復出具有三維一致的掩碼;
- #確保視圖一致性和感知合理性,一種新的基於優化的三維修復公式,利用二維影像修復;
- 一個新的用於三維編輯任務評估的資料集,包括對應的操作後的Groud Truth。
具體到方法上面,研究首先描述如何從單一視圖註解中初始化一個粗略的 3D 遮罩。將已標註的原始碼檢視表示為 I_1。將物件和來源視圖的稀疏資訊給一個互動式分割模型,用來估計初始來源物件遮罩#。然後將訓練視圖作為一個視訊序列,與
一起給予一個視訊實例分割模型V ,以計算
,其中
#是I_i 的物件掩碼的初始猜測。初始的遮罩通常在邊界附近是不準確的,因為訓練視圖實際上並不是相鄰的視訊幀,而視訊分割模型通常是未知 3D 的。
多視圖分割模組取得輸入的RGB 影像、對應的相機內在和外部參數,以及初始遮罩去訓練一個語意NeRF 。上圖描述了語意 NeRF 中使用的網路;對於點 x 和視圖目錄 d,除了密度 σ 和顏色 c 外,它還傳回一個 pre-sigmoid 型的物件 logit,s (x)。為了其快速收斂,研究者使用 instant-NGP 作為他們的 NeRF 架構。與光線r 相關聯的期望客觀性是透過在方程式中呈現r 上的點的對數而不是它們相對於密度的顏色而得到的:
然後使用分類損失進行監督:
用於監督基於NeRF 的多視圖分割模型的總體損失為:
#最後,採用兩個階段進行最佳化,進一步改進掩碼;在獲得初始三維掩碼後,從訓練視圖呈現掩碼,並用於監督二次多視圖分割模型作為初始假設(而不是視訊分割輸出)。
上圖顯示了視圖一致的修正方法概述。由於資料的缺乏妨礙了直接訓練三維修改修復模型,該研究利用現有的二維修復模型來獲得深度和外觀先驗,然後監督 NeRF 對完整場景的渲染擬合。這個嵌入的 NeRF 使用以下損失進行訓練:
#即使有感知損失,修復視圖之間的差異也會錯誤地引導模型收斂到低品質幾何(例如,攝影機附近可能形成“模糊” 幾何測量,以解釋每個視圖的不同資訊)。因此,研究員使用已產生的深度圖作為 NeRF 模型的額外指導,並在計算感知損失時分離權值,使用感知損失只擬合場景的顏色。為此,研究者使用了一個對包含不需要的物件的圖像進行了最佳化的 NeRF,並渲染了與訓練視圖對應的深度圖。其計算方法是用到相機的距離而不是點的顏色代替的方法:
然後將渲染的深度輸入到修復器模型,以獲得修復完的深度圖。研究發現,使用 LaMa 進行深度繪製,例如 RGB,可以獲得足夠高品質的結果。這個 NeRF 可以是與用於多視圖分割的相同模型,如果使用其他來源來獲取掩碼,如人工註釋的掩碼,一個新的 NeRF 將被安裝到場景中。然後,這些深度圖被用來監督已修復的 NeRF 的幾何形狀,透過其渲染深度然後將渲染的深度輸入到修復器模型,以獲得修復完的深度圖。研究發現,使用 LaMa 進行深度繪製,例如 RGB,可以獲得足夠高品質的結果。這個 NeRF 可以是與用於多視圖分割的相同模型,如果使用其他來源來獲取掩碼,如人工註釋的掩碼,一個新的 NeRF 將被安裝到場景中。然後,這些深度圖被用來監督已修復的NeRF 的幾何形狀,透過其渲染深度到修復的深度的到修復的深度的距離:
##多視圖分割:首先評估MVSeg 模型,沒有任何編輯修復。在本實驗中,假設稀疏影像點已經給出了一個現成的互動式分割模型,並且來源遮罩是可用的。因此,該任務是將來源遮罩傳輸到其他視圖中。下表顯示,新模型優於 2D(3D 不一致)和 3D 基準。此外研究者提出的兩階段最佳化有助於進一步改進所得到的遮罩。
下表顯示了 MV 方法與基準的比較,總的來說,新提出的方法明顯優於其他二維和三維修復方法。下表進一步顯示,移除幾何圖形結構的引導會降低已修復的場景品質。
定性結果如圖 6、圖 7 所示。圖 6 表明,本文方法可以重建具有詳細紋理的視圖一致場景,包括有光澤和無光澤表面的連貫視圖。圖 7 表明, 本文的感知方法減少了遮罩區域的精確重建約束,從而在使用所有影像時防止了模糊的出現,同時也避免了單一視圖監督造成的偽影。
以上是NeRF新研究來了:3D場景無痕移除不需要對象,精確到毛髮的詳細內容。更多資訊請關注PHP中文網其他相關文章!

Meta攜手Nvidia、IBM和Dell等合作夥伴,拓展了Llama Stack的企業級部署整合。在安全方面,Meta推出了Llama Guard 4、LlamaFirewall和CyberSecEval 4等新工具,並啟動了Llama Defenders計劃,以增強AI安全性。此外,Meta還向10個全球機構(包括致力於改善公共服務、醫療保健和教育的初創企業)發放了總額150萬美元的Llama Impact Grants。 由Llama 4驅動的全新Meta AI應用,被設想為Meta AI

公司開創性的人類互動公司Joi AI介紹了“ AI-Iatsionship”一詞來描述這些不斷發展的關係。 Joi AI的關係治療師Jaime Bronstein澄清說,這並不是要取代人類C

在線欺詐和機器人攻擊對企業構成了重大挑戰。 零售商與機器人ho積產品,銀行戰斗帳戶接管以及社交媒體平台與模仿者鬥爭。 AI的興起加劇了這個問題,Rende

AI代理人有望徹底改變營銷,並可能超過以前技術轉變的影響。 這些代理代表了生成AI的重大進步,不僅是處理諸如chatgpt之類的處理信息,而且還採取了Actio

人工智能對關鍵NBA遊戲4決策的影響 兩場關鍵遊戲4 NBA對決展示了AI在主持儀式中改變遊戲規則的角色。 首先,丹佛的尼古拉·喬基奇(Nikola Jokic)錯過了三分球,導致亞倫·戈登(Aaron Gordon)的最後一秒鐘。 索尼的鷹

傳統上,擴大重生醫學專業知識在全球範圍內要求廣泛的旅行,動手培訓和多年指導。 現在,AI正在改變這一景觀,克服地理局限性並通過EN加速進步

英特爾正努力使其製造工藝重回領先地位,同時努力吸引無晶圓廠半導體客戶在其晶圓廠製造芯片。為此,英特爾必須在業界建立更多信任,不僅要證明其工藝的競爭力,還要證明合作夥伴能夠以熟悉且成熟的工作流程、一致且高可靠性地製造芯片。今天我聽到的一切都讓我相信英特爾正在朝著這個目標前進。 新任首席執行官譚立柏的主題演講拉開了當天的序幕。譚立柏直率而簡潔。他概述了英特爾代工服務的若干挑戰,以及公司為應對這些挑戰、為英特爾代工服務的未來規劃成功路線而採取的措施。譚立柏談到了英特爾代工服務正在實施的流程,以更以客

全球專業再保險公司Chaucer Group和Armilla AI解決了圍繞AI風險的日益嚴重的問題,已聯手引入了新型的第三方責任(TPL)保險產品。 該政策保護業務不利


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

禪工作室 13.0.1
強大的PHP整合開發環境

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

SublimeText3漢化版
中文版,非常好用

SublimeText3 Linux新版
SublimeText3 Linux最新版

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。