高畫質影片竟不是真的，幾張照片渲染的3D場景讓你難辨真偽-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

高畫質影片竟不是真的，幾張照片渲染的3D場景讓你難辨真偽

PHPz

Aug 05, 2024 pm 08:15 PM

nerf理論

請注意，上述動圖完全是由多張照片渲染出來的 3D 場景。人類很難發現它們的破綻。

那讓我們一起看看，這種場景是怎麼實現的。

網格和點是最常見的三維場景表示法，因為它們是顯式的，非常適合基於 GPU/CUDA 的快速光柵化。相較之下，最新的神經輻射場（NeRF）方法建立在連續場景表徵的基礎上，通常使用體積光線渲染優化多層感知器（MLP），對捕捉到的場景進行新視角合成。雖然這些方法的連續性有助於最佳化，但渲染所需的隨機取樣成本很高，而且會產生雜訊。

來自法國蔚藍海岸大學的研究者引入了一種新方法，能夠結合這兩種方法的優點：3D 高斯表徵有著SOAT 視覺質量，並且在訓練時間上也進行了最佳化，而基於tile 的拋雪球演算法（tile-based splatting）在幾個資料集上以1080p 解析度實現SOTA 即時渲染。

論文地址：https://huggingface.co/papers/2308.04079

研究團隊下目標：對多張照片拍攝的場景進行即時渲染，並在典型真實場景中實現時間最優化。先前，Fridovich-Kei 等人提出的方法雖然實現了快速訓練，但難以達到目前 SOTA NeRF 方法所獲得的視覺質量，而後者需要長達 48 小時的訓練時間。還有研究提出快速但品質較低的輻射場方法，可以根據場景實現互動式渲染（每秒 10-15 幀），但這種方法無法實現高解析度下的即時渲染。

接下來，我們來看看本文是如何實現的。

方法

團隊的解決方案主要由三個部分組成。

第一，引入 3D 高斯作為一種靈活而富有表現力的場景表徵。輸入與 NeRF 方法類似，即使用結構 - 運動（SfM）校準像機，並且使用稀疏點雲初始化 3D 高斯集合，點雲來自 SfM 過程。此外，研究只用 SfM 點作為輸入就能獲得高品質的結果。需要注意的是，對於 NeRF 合成資料集，即使採用隨機初始化，本文方法也能獲得高品質的結果。研究表明，3D 高斯是一個很好的選擇。

第二，最佳化 3D 高斯屬性，即 3D 位置、不透明度?、各向異性協方差和球諧波（SH）係數。最佳化過程產生了一個相當緊湊、非結構化和精確的場景表徵。

第三，即時渲染解決方案，研究使用快速 GPU 排序演算法。不過，由於採用了3D 高斯表徵，可以在遵循可見度排序的情況下進行各向異性拼接，這要歸功於排序和?- blending— 並通過跟踪所需的盡可能多排序拼接的遍歷，實現快速準確的向後傳遞。

方法概覽

綜上，本文做出了以下貢獻：

🎜 >

引入各向異性3D 高斯作為輻射場的高品質、非結構化表徵；
3D高斯屬性的最佳化方法，與自適應密度控制交織在一起，為捕捉到的場景創建高品質的表徵；
針對GPU 的快速可微分渲染方法，該方法具有可視性感知功能，允許各向異性拼接和快速反向傳播，以實現高品質的新視圖合成。

實驗

圖顯示了本文的方法與以往方法效果的比較。

場景自上而下依序為來自Mip-NeRF360 資料集的自行車、花園、櫃檯和房間；來自深度混合資料集的遊戲室（更多比較請閱讀原文）。圖中把不同方法產生的顯著差異已經標出，如自行車的輻條、花園遠處的房屋玻璃、鐵籃子的桿子以及玩具小熊。

可以觀察出，本文的方法相比以往的方法在細節上更具優勢。高畫質影片竟不是真的，幾張照片渲染的3D場景讓你難辨真偽

影片中可以看到更明顯的差異

除此之外，在圖6 中我們可以看到，即使迭代7K 次（∼ 5 分鐘），本文方法也能很好地捕捉列車的細節。在迭代 30K 次（∼35 分鐘）時，背景偽影明顯減少。對於花園場景，差異幾乎不明顯，7K 次迭代（∼8 分鐘）已經是非常高的品質了。

研究團隊採用Mip-NeRF360 建議的方法，將資料集分為訓練/ 測試兩部分，每隔8 張照片進行測試，以便進行一致且有意義的比較，從而產生誤差指標，並使用文獻中最常使用的標準PSNR、L-PIPS 和SSIM 指標，詳細資料見表1。

表 1 展現了透過三個資料集計算得出的新方法與先前的工作相比的定量評估。標有“†”的結果直接採用了原論文，其他結果均為該實驗團隊的實驗結果。

合成 NeRF 的 PSNR 分數。可以看到本文方法在多數情況下分數都較好，甚至達到最優。

消融實驗

啲>消融實驗

所做的不同貢獻和演算法選擇分離出來，並建立了一組實驗來衡量它們的效果。對演算法的以下幾個方面進行了測試：從 SfM 初始化、緻密化策略、各向異性協方差、允許無限數量的斑塊具有梯度以及球諧波的使用。下表總結了每種選擇的定量效果。

我們來看看更直觀的效果。使用 SfM 點初始化會產生更好的效果。 Clone 和Split 兩種情況下的消融緻密化策略限制接受漸變的點的數量，對視覺品質影響是顯著的。左圖：限制接收梯度的 10 個高斯點。右圖：本文的完整方法。想了解更多詳細內容，請閱讀原文。

以上是高畫質影片竟不是真的，幾張照片渲染的3D場景讓你難辨真偽的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

最新的最佳及時工程技術的年度彙編Apr 10, 2025 am 11:22 AM

對於那些可能是我專欄新手的人，我廣泛探討了AI的最新進展，包括體現AI，AI推理，AI中的高科技突破，及時的工程，AI培訓，AI，AI RE RE等主題

歐洲的AI大陸行動計劃：Gigafactories，Data Labs和Green AIApr 10, 2025 am 11:21 AM

歐洲雄心勃勃的AI大陸行動計劃旨在將歐盟確立為人工智能的全球領導者。一個關鍵要素是建立了AI Gigafactories網絡，每個網絡都有大約100,000個高級AI芯片 - 2倍的自動化合物的四倍

微軟對AI代理申請的統一方法：企業的明顯勝利微軟最近公告的新AI代理能力清晰而統一的演講給人留下了深刻的印象。與許多技術公告陷入困境不同

向員工出售AI策略：Shopify首席執行官的宣言Apr 10, 2025 am 11:19 AM

Shopify首席執行官TobiLütke最近的備忘錄大膽地宣布AI對每位員工的基本期望是公司內部的重大文化轉變。這不是短暫的趨勢。這是整合到P中的新操作範式

IBM啟動具有完整AI集成的Z17大型機Apr 10, 2025 am 11:18 AM

IBM的Z17大型機：集成AI用於增強業務運營上個月，在IBM的紐約總部，我收到了Z17功能的預覽。以Z16的成功為基礎（於2022年推出並證明持續的收入增長

5 Chatgpt提示取決於別人並完全相信自己Apr 10, 2025 am 11:17 AM

解鎖不可動搖的信心，消除了對外部驗證的需求！這五個CHATGPT提示將指導您完全自力更生和自我感知的變革轉變。只需複制，粘貼和自定義包圍

AI與您的思想危險相似Apr 10, 2025 am 11:16 AM

人工智能安全與研究公司 Anthropic 最近的一項[研究]開始揭示這些複雜過程的真相，展現出一種令人不安地與我們自身認知領域相似的複雜性。自然智能和人工智能可能比我們想像的更相似。窺探內部：Anthropic 可解釋性研究 Anthropic 進行的研究的新發現代表了機制可解釋性領域的重大進展，該領域旨在反向工程 AI 的內部計算——不僅僅觀察 AI 做了什麼，而是理解它在人工神經元層面如何做到這一點。想像一下，試圖通過繪製當有人看到特定物體或思考特定想法時哪些神經元會放電來理解大腦。 A