ホームページ >テクノロジー周辺機器 >AI >初心者にとって必須の NeRF 学習ノートは、すべてについての洞察を提供します。
放射場: 光源から発せられた光は、シーン内の伝播と反射のプロセス中に形成されます。 エネルギー分配。平たく言えば、空間上の特定の場所、特定の方向の放射線情報(エネルギー分布)を記録する機能で、実際には色や明るさ、影などの情報が放射線情報(エネルギー分布)となります。ここでの 方向 には特別な注意が必要です。これは NeRF が真の再構築を達成するための重要な要素の 1 つです。
これは、神経放射線場の概念につながります。
神経放射線フィールド: ニューラル ネットワークを使用して、 空間 位置 の任意の 方向 の放射線を保存します。原文の説明は次のとおりです。
より標準化された式は次のように表されます。
入力3D 位置 (x、y、z) と 2D 視野角方向 ()、出力は色と体積密度です
NeRF 固有のネットワーク結果は、次のような原文を参照しています:
ボリューム レンダリングについて説明する前に。まずネットワークの効果を見てみましょう:
見る角度によって色が異なることがわかります。これは、従来の再構成に対する NeRF の非常に重要な利点の 1 つです~
NeRF の核心: ボリューム レンダリング
NeRF ボリューム レンダリングの 2 番目の核心点に入りましょう。 。ボリューム レンダリングは、2D 画像に色と濃度をレンダリングするために使用される手法です。
ボリューム レンダリングの手順を要約すると、次のようになります。
各ピクセルを貫通する光線がカメラの光学中心から放射されます。 . 3 次元のサンプリング ポイントを取得します。
サンプリング ポイントの座標と視野角の方向を MLP に送信して、色と体積密度を計算します。
体積密度に応じて色情報を統合 (スタック) してフォームを作成します。 2D 画像もちろん、離散画像実際に使用される式のバージョン:
暗黙的再構成プロセス
神経放射線場とボリューム レンダリングについて説明した後、次は次のようになります。完全な再構築プロセスを開始します~完成したパイプラインを形成する前に、解決する必要がある問題がまだ 2 つあります:
この論文は、位置コーディングの効果の比較を視覚的に示しています:
位置コーディングがなければ、モデルは高周波の幾何学情報やテクスチャ情報を表現できないことがわかります~
多層の採用:
トレーニング プロセスは次のとおりです。
評価指標:
実験設定:
#実験結果は、さまざまな材質のボールの非点収差も良好に表現できることを示しています~アブレーション実験:
以上が初心者にとって必須の NeRF 学習ノートは、すべてについての洞察を提供します。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。