25平方キロメートルという史上最大規模の再建！ NeRF-XL：マルチカード合同トレーニングが実に効果的！-AI-php.cn

ホームページ

テクノロジー周辺機器

25平方キロメートルという史上最大規模の再建！ NeRF-XL：マルチカード合同トレーニングが実に効果的！

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 30, 2024 pm 04:50 PM

モデル電車

原題: NeRF-XL: Scaling NeRFs with Multiple GPUs

論文リンク: https://research.nvidia.com/labs/toronto-ai/nerfxl/assets/nerfxl.pdf

プロジェクトリンク: https:/ / /research.nvidia.com/labs/toronto-ai/nerfxl/

著者の所属: NVIDIA カリフォルニア大学バークレー校

25平方キロメートルという史上最大規模の再建！ NeRF-XL：マルチカード合同トレーニングが実に効果的！

論文のアイデア:

この論文は、原理である NeRF-XL を提案します。複数のグラフィックスプロセッシングユニット (GPU) にニューラルレイフィールド (NeRF) を分散する方法。これにより、任意の大きな容量で NeRF のトレーニングとレンダリングが可能になります。この論文ではまず、大規模なシーンを複数の独立してトレーニングされた NeRF に分解するいくつかの既存の GPU 手法 [9、15、17] をレビューし、トレーニングに追加のコンピューティングリソース (GPU) を使用すると再構成の改善が妨げられる、これらの手法に関するいくつかの基本的な問題を特定します。品質。 NeRF-XL はこれらの問題を解決し、より多くのハードウェアを使用するだけで、任意の数のパラメータを持つ NeRF をトレーニングおよびレンダリングできるようにします。私たちのアプローチの中核は、新しい分散トレーニングとレンダリングの定式化です。これは数学的には古典的な単一 GPU の場合と同等であり、GPU 間の通信を最小限に抑えます。任意の多数のパラメータで NeRF のロックを解除することにより、私たちの方法は NeRF の GPU スケーリング則を初めて明らかにし、パラメータの数が増加するにつれて再構成品質が向上し、使用される GPU の増加に伴って速度が向上することを示しています。この論文は、約 258K の画像を含み、25 平方キロメートルの市街地をカバーする MatrixCity [5] を含む、さまざまなデータセットに対する NeRF-XL の有効性を実証します。

紙のデザイン:

新しい視点合成の最近の進歩により、神経放射場 (NeRF) を捕捉する能力が大幅に向上し、プロセスがよりアクセスしやすくなりました。これらの進歩により、より大きなシーンとその中のより細かいディテールを再構築できるようになります。空間スケールを拡大する (例: 数キロにわたる都市景観をキャプチャする) か、詳細レベルを高める (例: 野原の草の葉をスキャンする) かにかかわらず、キャプチャされたシーンの範囲を広げるには、より多くの情報を NeRF に組み込む必要があります。正確な再構成を実現します。したがって、情報が豊富なシーンの場合、再構築に必要なトレーニング可能なパラメーターの数が 1 つの GPU のメモリ容量を超える可能性があります。

この論文では、複数の GPU 全体にニューラル放射状シーン (NeRF) を効率的に分散するための原則に基づいたアルゴリズムである NeRF-XL を提案します。本記事の手法を利用すれば、ハードウェアリソースを増やすだけで、情報量の多いシーン（大規模かつ高精細なシーンを含む）を撮影できるようになります。 NeRF-XL の中核は、一連の互いに素な空間領域に NeRF パラメータを割り当て、それらを GPU 全体で共同トレーニングすることです。逆方向伝播で勾配を同期する従来の分散トレーニングプロセスとは異なり、私たちの方法では順方向伝播で情報を同期するだけで済みます。さらに、分散設定で方程式と関連する損失項を注意深くレンダリングすることで、GPU 間で必要なデータ転送を大幅に削減します。この斬新な書き換えにより、トレーニングとレンダリングの効率が向上します。この方法の柔軟性とスケーラビリティにより、この記事では複数の GPU を効率的に最適化し、複数の GPU を使用して効率的なパフォーマンスの最適化を行うことができます。

私たちの研究は、独立した立体視 NeRF のセットをトレーニングすることで大規模なシーンをモデル化する GPU アルゴリズムを採用した最近のアプローチとは対照的です [9、15、17]。これらの方法では GPU 間の通信は必要ありませんが、各 NeRF は背景領域を含む空間全体をモデル化する必要があります。これにより、GPU の数が増加するにつれて、モデル容量の冗長性が高まります。さらに、これらの方法ではレンダリング時に NeRF をブレンドする必要があるため、視覚的な品質が低下し、重複領域にアーティファクトが生じます。したがって、NeRF-XL とは異なり、これらの方法はトレーニングでより多くのモデルパラメーター (より多くの GPU に相当) を使用し、視覚的な品質の向上を達成できません。

この論文では、街頭スキャン、ドローン上空飛行、物体中心のビデオなど、さまざまな撮影ケースを通じて私たちのアプローチの有効性を実証しています。ケースの範囲は、小規模なシーン (10 平方メートル) から都市全体 (25 平方キロメートル) まで多岐にわたります。私たちの実験では、より多くのコンピューティングリソースを最適化プロセスに割り当てると、NeRF-XL のビジュアル品質 (PSNR で測定) とレンダリング速度が向上し始めることがわかりました。したがって、NeRF-XL を使用すると、あらゆる空間スケールと詳細のシーンで任意の容量で NeRF をトレーニングすることが可能になります。

25平方キロメートルという史上最大規模の再建！ NeRF-XL：マルチカード合同トレーニングが実に効果的！

図 1: この記事の原理ベースのマルチ GPU 分散トレーニングアルゴリズムは、NeRF を任意の大規模なスケールに拡張できます。

25平方キロメートルという史上最大規模の再建！ NeRF-XL：マルチカード合同トレーニングが実に効果的！

図 2: 独立したトレーニングとマルチ GPU の共同トレーニング。複数の NeRF [9、15、18] を個別にトレーニングするには、各 NeRF が焦点領域とその周囲環境の両方をモデル化する必要があり、これがモデル容量の冗長性につながります。対照的に、私たちの共同トレーニング方法は重複しない NeRF を使用するため、冗長性がありません。

25平方キロメートルという史上最大規模の再建！ NeRF-XL：マルチカード合同トレーニングが実に効果的！

図 3: 独立したトレーニングでは、新しい視点を統合するときにブレンディングが必要です。ブレンディングが 2D [9、15] で実行されるか、3D [18] で実行されるかにかかわらず、レンダリングにブラーが導入されます。

25平方キロメートルという史上最大規模の再建！ NeRF-XL：マルチカード合同トレーニングが実に効果的！

図 4: 独立したトレーニングにより、さまざまなカメラの最適化が行われます。 NeRF では、不正確なカメラ自体、または他のすべてのカメラ、および基礎となる 3D シーンを変換することでカメラの最適化を実現できます。したがって、カメラの最適化とともに複数の NeRF を個別にトレーニングすると、カメラの補正とシーンのジオメトリに不一致が生じる可能性があり、ハイブリッドレンダリングにさらなる困難をもたらします。

25平方キロメートルという史上最大規模の再建！ NeRF-XL：マルチカード合同トレーニングが実に効果的！

図 5: 3D ブレンドによって発生する可能性のある視覚的なアーティファクト。左側の画像は、2 つの GPU を使用してトレーニングされた MegaNeRF の結果を示しています。 0% オーバーラップでは、独立したトレーニングにより境界にアーティファクトが表示されますが、15% オーバーラップでは、3D ブレンディングにより重大なアーティファクトが表示されます。右側の画像は、このアーティファクトの原因を示しています。独立してトレーニングされた各 NeRF は正しい色をレンダリングしますが、ブレンドされた NeRF は正しい色レンダリングを保証しません。

25平方キロメートルという史上最大規模の再建！ NeRF-XL：マルチカード合同トレーニングが実に効果的！

図 6: この記事のトレーニングプロセス。私たちの方法では、すべての GPU 上で複数の NeRF を共同でトレーニングし、各 NeRF が互いに素な空間領域をカバーします。 GPU 間の通信は前方パスでのみ発生し、後方パスでは発生しません (灰色の矢印で示されている)。 (a) この論文は、各 NeRF を評価してサンプルの色と濃度を取得し、これらの値を他のすべての GPU にブロードキャストしてグローバルボリュームレンダリングを行うことで実装できます (セクション 4.2 を参照)。 (b) ボリュームレンダリング方程式を書き直すことにより、この論文はデータ送信量をレイごとに 1 つの値に大幅に削減し、効率を向上させることができます (セクション 4.3 を参照)。

実験結果:

25平方キロメートルという史上最大規模の再建！ NeRF-XL：マルチカード合同トレーニングが実に効果的！

図 7: 定性的比較。以前の研究と比較して、私たちの方法はマルチ GPU 構成を効果的に活用し、あらゆる種類のデータのパフォーマンスを向上させます。

25平方キロメートルという史上最大規模の再建！ NeRF-XL：マルチカード合同トレーニングが実に効果的！

図 8: 定量的な比較。独立したトレーニングに基づいた以前の研究では、追加の GPU を追加してもパフォーマンスの向上を達成できませんでしたが、私たちの方法ではトレーニングリソースが増加するにつれてレンダリングの品質と速度が向上しました。

25平方キロメートルという史上最大規模の再建！ NeRF-XL：マルチカード合同トレーニングが実に効果的！

図 9: この記事のメソッドのスケーラビリティ。 GPU の数が増えると、より多くの学習可能なパラメーターが可能になり、その結果、モデルの容量が増加し、品質が向上します。

25平方キロメートルという史上最大規模の再建！ NeRF-XL：マルチカード合同トレーニングが実に効果的！

図 10: 大規模キャプチャでのその他のレンダリング結果。このペーパーでは、より多くの GPU を使用して、より大規模にキャプチャされたデータセットに対するメソッドの堅牢性をテストします。これらのデータのビデオツアーについては、この記事の Web ページを参照してください。

25平方キロメートルという史上最大規模の再建！ NeRF-XL：マルチカード合同トレーニングが実に効果的！

図 11: University4 データセット上の PyTorch DDP との比較。 PyTorch Distributed Data Parallel (DDP) は、GPU 全体に光を分散することでレンダリングを高速化するように設計されています。対照的に、私たちの方法は GPU 全体にパラメータを分散し、クラスター内の単一 GPU のメモリ制限を突破し、モデルの容量を拡張して品質を向上させることができます。

25平方キロメートルという史上最大規模の再建！ NeRF-XL：マルチカード合同トレーニングが実に効果的！

図 12: University4 の同期コスト。パーティションベースのボリュームレンダリング (セクション 4.3 を参照) では、元のサンプルベースの通信 (セクション 4.2 を参照) よりもはるかに安価なタイルベースの通信が可能になるため、より高速なレンダリングが可能になります。

概要:

要約すると、この論文は、大規模なシーンを独立してトレーニングされた NeRF (神経放射場) に分解する既存の方法を再検討し、追加のコンピューティングリソース (GPU) の問題の効果的な利用を妨げる重大な障壁を発見します。これは、マルチ GPU セットアップを活用して大規模な NeRF パフォーマンスを向上させるという中心的な目標に矛盾します。したがって、このホワイトペーパーでは、マルチ GPU セットアップを効率的に活用し、重複しない複数の NeRF を共同トレーニングすることで、あらゆる規模で NeRF のパフォーマンスを向上できる原則に基づいたアルゴリズムである NeRF-XL を紹介します。重要なのは、私たちの方法はヒューリスティックルールに依存せず、マルチ GPU 設定で NeRF のスケーリング則に従い、さまざまな種類のデータに適用できることです。

引用:

りー

以上が25平方キロメートルという史上最大規模の再建！ NeRF-XL：マルチカード合同トレーニングが実に効果的！の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

個人的なハッキングはかなり激しいクマになりますMay 11, 2025 am 11:09 AM

サイバー攻撃が進化しています。一般的なフィッシングメールの時代は終わりました。サイバー犯罪の将来は超個人化されており、高度にターゲットを絞った攻撃を作成するために、容易に利用可能なオンラインデータとAIを活用しています。あなたの仕事を知っている詐欺師を想像してください、あなたのf

教皇レオXIVは、AIが彼の名前の選択にどのように影響したかを明らかにしますMay 11, 2025 am 11:07 AM

枢機of大学への彼の就任演説では、シカゴ生まれのロバート・フランシス・プレボスト、新たに選出された教皇レオ14世は、彼の同名の教皇レオXIIIの影響について議論しました。

初心者および専門家向けのFastapi -MCPチュートリアル-Analytics VidhyaMay 11, 2025 am 10:56 AM

このチュートリアルでは、モデルコンテキストプロトコル（MCP）とFastAPIを使用して、大規模な言語モデル（LLM）と外部ツールを統合する方法を示しています。 FastAPIを使用して簡単なWebアプリケーションを構築し、それをMCPサーバーに変換し、Lを有効にします

DIA-1.6B TTS：最高のテキストからダイアログの生成モデル - 分析VidhyaMay 11, 2025 am 10:27 AM

DIA-1.6Bを探索：資金がゼロの2人の学部生によって開発された画期的なテキストからスピーチモデル！この16億個のパラメーターモデルは、笑い声やくしゃみなどの非言語的手がかりを含む、非常に現実的なスピーチを生成します。この記事ガイド

AIがメンターシップをこれまで以上に意味のあるものにする3つの方法May 10, 2025 am 11:17 AM

私は心から同意します。私の成功は、メンターの指導に密接に関連しています。特にビジネス管理に関する彼らの洞察は、私の信念と実践の基盤を形成しました。この経験は、メンターへの私のコミットメントを強調しています

AIは、鉱業で新しい可能性を発掘しますMay 10, 2025 am 11:16 AM

AIはマイニング機器を強化しました採掘操作環境は厳しく危険です。人工知能システムは、最も危険な環境から人間を排除し、人間の能力を高めることにより、全体的な効率とセキュリティを改善するのに役立ちます。人工知能は、マイニング操作で使用される自動運転トラック、ドリル、ローダーの電源にますます使用されています。これらのAI搭載車両は、危険な環境で正確に動作し、それにより安全性と生産性が向上します。一部の企業は、大規模な鉱業作業のために自動鉱業車両を開発しています。挑戦的な環境で動作する機器には、継続的なメンテナンスが必要です。ただし、メンテナンスは重要なデバイスをオフラインに保ち、リソースを消費する可能性があります。より正確なメンテナンスとは、高価で必要な機器の稼働時間が増加し、大幅なコスト削減を意味します。 AI駆動型

AIエージェントが25年で最大の職場革命を引き起こす理由May 10, 2025 am 11:15 AM

SalesforceのCEOであるMarc Benioffは、AIエージェントが推進する記念碑的な職場革命、Salesforceとその顧客ベース内ですでに進行中の変革を予測しています。彼は、従来の市場から、に焦点を当てた非常に大きな市場への移行を想定しています

ai hrは、aiの養子縁組が舞い上がるので私たちの世界を揺るがそうとしていますMay 10, 2025 am 11:14 AM

HRでのAIの台頭：ロボットの同僚との労働力をナビゲートする AIと人事（HR）への統合は、もはや未来の概念ではありません。急速に新しい現実になりつつあります。このシフトは、人事の専門家と従業員の両方のDEMに影響を与えます

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティングサービスをチェックしてください。

SublimeText3 英語版

推奨: Win バージョン、コードプロンプトをサポート!

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、