検索
ホームページテクノロジー周辺機器AI新タイトル:リアルタイムレンダリングが進化!光線に基づく革新的な 3D 再構成手法

新タイトル:リアルタイムレンダリングが進化!光線に基づく革新的な 3D 再構成手法写真

論文リンク:https://arxiv.org/pdf/2310.19629

コードリンク:https://github.com/vLAR-group/RayDF

ホームページ: 書き換える必要があるコンテンツは次のとおりです: https://vlar-group.github.io/RayDF .html

書き換えられた内容: 実装方法:

新タイトル:リアルタイムレンダリングが進化!光線に基づく革新的な 3D 再構成手法

RayDF の全体的なプロセスとコンポーネントは次のとおりです (図 1 を参照)

1. はじめに

機械学習による正確かつ効率的な 3D 形状表現は、視覚やロボット工学の分野における多くの最先端のアプリケーションにおいて非常に重要です。ただし、3D 座標に基づく既存の暗黙的な式では、3D 形状を表現したり 2D 画像をレンダリングしたりするときに高価な計算コストが必要になりますが、これとは対照的に、レイベースの方法は 3D 形状を効率的に推論できます。ただし、既存の光線ベースの手法では、複数の視野角での幾何学的一貫性が考慮されていないため、未知の視野角で正確な幾何学的形状を復元することが困難です。 RayDF、マルチビューの幾何学的一貫性のためのレイベースの暗黙的な表現方法。この方法は、新しい二重光線可視性分類器とマルチビュー一貫性最適化モジュール (最適化モジュール)

を導入することにより、単純な光線表面距離フィールドに基づいており、幾何学的条件を満たす光線表面距離を取得する方法を学習します。複数の視野角の一貫性。実験結果は、修正された方法が 3 つのデータセットで優れた 3D 表面再構成パフォーマンスを達成し、座標ベースの方法よりも 1000 倍速いレンダリング速度を達成することを示しています (表 1 を参照)。

新タイトル:リアルタイムレンダリングが進化!光線に基づく革新的な 3D 再構成手法主な貢献は次のとおりです:

光線表面距離フィールドを使用して 3 次元形状を表現し、この式は、既存の座標ベースの表現よりも効率的です。

  • 新しい二重光線可視性分類器を設計しました。光線のペアの空間関係を学習することにより、学習された光線表面距離フィールドは、複数の視野角の下で幾何学的一貫性を維持できます。
  • 3 次元形状再構成におけるこの方法の精度と効率は、複数のデータセットで証明されています。

  • 2. 方法
2.1 概要

図 1 に示すように、RayDF には 2 つのネットワークと 1 つの最適化モジュールが含まれています。メイン ネットワークの光線-表面距離ネットワークの場合、光線を入力するだけで、光線の開始点と光線が当たる幾何学的表面点の間の距離値を取得できます。このうち、図 2 に示すように、RayDF は 3 次元シーンを囲むボールを使用して入力光線をパラメータ化し、パラメータ化された 4 次元の球座標 (入射点と出射点) をネットワーク入力として使用します。補助ネットワーク デュアル レイ可視性分類器の場合、一対のレイと幾何学的表面点を入力として、2 つのレイ間の相互可視性を予測します。この補助ネットワークがトレーニングされると、後続のマルチビュー整合性最適化モジュールで重要な役割を果たします。

図 2 光線パラメータ化と光線表面距離フィールドのネットワーク構造新タイトル:リアルタイムレンダリングが進化!光線に基づく革新的な 3D 再構成手法

2.2 二重光線可視性分類子

このメソッドでは、の補助ネットワークは、2 つの入力レイが同時に表面点を認識できるかどうかを予測するバイナリ分類器です。図 3 に示すように、2 つの入力レイから取得された特徴は平均化され、予測結果が 2 つのレイの順序によって影響を受けないようになっています。同時に、表面点を個別にエンコードすることによって得られた特徴は、光線特徴の後に結合されて光線特徴が強化され、それによって分類器の精度が向上します。

デュアルレイ可視性分類器のフレームワーク構造を図 3 に示します。新タイトル:リアルタイムレンダリングが進化!光線に基づく革新的な 3D 再構成手法

2.3 マルチビュー一貫性の最適化

設計されたメインネットワークの光線表面距離ネットワークと補助ネットワークの二重光線可視性分類器を基礎として使用し、マルチビュー一貫性最適化の主要モジュールを導入して、2つのネットワーク上で2段階のトレーニングを実行します。

(1) まず、補助ネットワーク デュアルレイ可視性分類器のトレーニング用のレイ ペアを構築します。画像内の光線 (画像内のピクセルに対応) の場合、対応する空間表面点はその光線表面距離によってわかります。それをトレーニング セット内の残りの視野角に投影して別の光線を取得し、この光線を取得します。対応する光線と表面の距離があり、この記事では 2 つの光線が互いに見えるかどうかを判断するためのしきい値を 10 mm に設定しています。

(2) 第 2 段階は、メイン ネットワークの光線表面距離ネットワークをトレーニングして、その予測距離フィールドがマルチビューの一貫性を満たすようにすることです。図 4 に示すように、主光線とその表面点の場合、表面点は球の中心で均一にサンプリングされ、いくつかのマルチビュー光線が得られます。メイン レイとこれらのマルチビュー レイを 1 つずつペアにすると、トレーニングされたデュアルレイ可視性分類器を通じて相互の可視性を取得できます。次に、光線-表面距離ネットワークを通じてこれらの光線の光線-表面距離を予測します。主光線と特定のサンプリング光線が相互に見える場合、2 つの光線の光線-表面距離によって計算された表面点は同じになるはずです。ポイント; によると、対応する損失関数が設計され、メイン ネットワークがトレーニングされ、最終的に光線表面距離フィールドがマルチビューの一貫性を満たすことが可能になります。

新タイトル:リアルタイムレンダリングが進化!光線に基づく革新的な 3D 再構成手法

2.4 表面法線導出と外れ値点の除去

シーン表面の端の深度値には突然変異 (不連続性) があることが多く、神経的なネットワークは連続関数であるため、前述の光線表面距離フィールドでは、表面のエッジでの不正確な距離値が容易に予測され、その結果、エッジの幾何学的表面にノイズが発生します。幸いなことに、図 5 に示すように、設計された光線表面距離フィールドには優れた特徴があります。推定された各 3 次元表面点の法線ベクトルは、ネットワークの自動微分を通じて閉じた形式で簡単に見つけることができます。したがって、ネットワークの推論段階で表面点の法線ベクトルユークリッド距離を計算することができ、その距離値が閾値よりも大きい場合、表面点を外れ値とみなし除去することで、きれいな三次元再構成表面を得ることができます。 。

新タイトル:リアルタイムレンダリングが進化!光線に基づく革新的な 3D 再構成手法

#図 5 表面法線計算

3. 実験

提案手法の有効性を検証するため、実験を行った。 3 つのデータセットに対して実験が行われました。 3 つのデータ セットは、オブジェクト レベルの合成データ セット Blender [1]、シーン レベルの合成データ セット DM-SR [2]、およびシーン レベルの実データ セット ScanNet [3] です。パフォーマンスを比較するために 7 つのベースラインを選択しました。このうち、OF [4]/DeepSDF [5]/NDF [6]/NeuS [7] は座標ベースのレベルセット方式、DS-NeRF [8] は深度教師あり NeRF ベースの方式、LFN [ 9] と PRIF [10] は、2 つのレイベースのベースラインです。

RayDF メソッドは、テクスチャを学習するために放射ブランチを直接追加するのが簡単であるため、放射フィールドの予測をサポートするベースライン モデルと比較できます。したがって、この論文の比較実験は 2 つのグループに分けられ、最初のグループ (グループ 1) は距離 (ジオメトリ) のみを予測し、2 番目のグループ (グループ 2) は距離と放射輝度の両方 (ジオメトリとテクスチャ) を予測します

3.1 Blender データセットの評価

表 2 と図 6 からわかるように、グループ 1 と 2 では、RayDF は表面再構成、特に最も重要な ADE 指標で優れた結果を達成しました。およびレイベースのベースライン。同時に、RayDF は、放射輝度場レンダリングの点で、DS-NeRF に匹敵し、LFN や PRIF を上回るパフォーマンスも達成しました。

新タイトル:リアルタイムレンダリングが進化!光線に基づく革新的な 3D 再構成手法

新タイトル:リアルタイムレンダリングが進化!光線に基づく革新的な 3D 再構成手法

#図 6 Blender データセットの視覚的比較

3.2 DM-SR での評価データセット

表 3 からわかるように、RayDF は最も重要な ADE 指標のすべてのベースラインを上回っています。同時に、グループ 2 の実験では、RayDF は正確な表面形状を確実に復元しながら、高品質の新しいビュー合成を取得することができました (図 7 を参照)。

新タイトル:リアルタイムレンダリングが進化!光線に基づく革新的な 3D 再構成手法

新タイトル:リアルタイムレンダリングが進化!光線に基づく革新的な 3D 再構成手法図 7 DM-SR データ セットの視覚的比較

3.3 ScanNet データセットの評価

表 4 は、困難な現実世界のシナリオにおける RayDF とベースラインのパフォーマンスを比較しています。最初と 2 番目のグループでは、RayDF はほぼすべての評価指標でベースラインを大幅に上回り、複雑な現実世界の 3D シーンの回復において明らかな利点を示しています

新タイトル:リアルタイムレンダリングが進化!光線に基づく革新的な 3D 再構成手法

新タイトル:リアルタイムレンダリングが進化!光線に基づく革新的な 3D 再構成手法

##以下は、図 8 ScanNet データセットの視覚的な比較を書き直したものです。 図 8 に、ScanNet データセットの視覚的な比較結果を示します

3.4 アブレーション研究

Blender データセットでアブレーション実験を実施しました論文の表 5 は、重要なアブレーション実験を示しています二重光線可視性分類器の結果を表 5 (1) に示します。二重光線可視性分類器の助けがなければ、光線表面距離フィールドは、新しい画角: 光線は適切な距離値を予測します (図 9 を参照)。

  • 分類器の入力では、表 5 (2) および (3) に示すように、表面点の距離値が補助として選択されている場合、または入力表面点の座標が補助として選択されます。補助情報を提供しないと、分類器が取得する精度と F1 スコアが低くなり、その結果、光線表面距離ネットワークに提供される可視情報が不十分となり、不正確な距離値が予測されます。
  • 表 5 (4) に示すように、一対の光線を非対称に入力することにより、トレーニングされた分類器の精度は高くなりますが、F1 スコアは低くなります。これは、この分類器が対称入力レイでトレーニングされた分類器よりも堅牢性が大幅に低いことを示しています。

  • 他の切除手術については、論文および論文の付録でご覧いただけます

新タイトル:リアルタイムレンダリングが進化!光線に基づく革新的な 3D 再構成手法

必要図 9 は、分類器を使用した場合と使用しない場合の視覚的な比較を示しています新タイトル:リアルタイムレンダリングが進化!光線に基づく革新的な 3D 再構成手法

4. 結論

レイベースのマルチビュー整合性フレームワークを使用する場合この方法により、三次元形状表現を効率的かつ正確に学習できるという結論が得られました。この論文では、単純な光線表面距離フィールドを使用して 3 次元形状の幾何学形状を表現し、新しい二重光線可視性分類器を使用してマルチビューの幾何学的一貫性をさらに達成しています。複数のデータセットでの実験により、RayDF メソッドが非常に高いレンダリング効率と優れたパフォーマンスを備えていることが証明されました。 RayDF フレームワークのさらなる拡張は歓迎されます。ホームページでさらに多くの視覚化結果を確認できます。

書き換える必要がある内容は次のとおりです: https://vlar-group.github.io/RayDF.html

#書き換える必要がある内容は次のとおりです: 元のリンク: https://mp.weixin.qq.com/s/dsrSHKT4NfgdDPYcKOhcOA新タイトル:リアルタイムレンダリングが進化!光線に基づく革新的な 3D 再構成手法

以上が新タイトル:リアルタイムレンダリングが進化!光線に基づく革新的な 3D 再構成手法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
迅速なエンジニアリングにおける思考のグラフは何ですか迅速なエンジニアリングにおける思考のグラフは何ですかApr 13, 2025 am 11:53 AM

導入 迅速なエンジニアリングでは、「思考のグラフ」とは、グラフ理論を使用してAIの推論プロセスを構造化および導く新しいアプローチを指します。しばしば線形sを含む従来の方法とは異なります

Genaiエージェントとの電子メールマーケティングを組織に最適化しますGenaiエージェントとの電子メールマーケティングを組織に最適化しますApr 13, 2025 am 11:44 AM

導入 おめでとう!あなたは成功したビジネスを運営しています。ウェブページ、ソーシャルメディアキャンペーン、ウェビナー、会議、無料リソース、その他のソースを通じて、毎日5000の電子メールIDを収集します。次の明白なステップはです

Apache Pinotによるリアルタイムアプリのパフォーマンス監視Apache Pinotによるリアルタイムアプリのパフォーマンス監視Apr 13, 2025 am 11:40 AM

導入 今日のペースの速いソフトウェア開発環境では、最適なアプリケーションパフォーマンスが重要です。応答時間、エラーレート、リソース利用などのリアルタイムメトリックを監視することで、メインに役立ちます

ChatGptは10億人のユーザーにヒットしますか? 「わずか数週間で2倍になりました」とOpenai CEOは言いますChatGptは10億人のユーザーにヒットしますか? 「わずか数週間で2倍になりました」とOpenai CEOは言いますApr 13, 2025 am 11:23 AM

「ユーザーは何人いますか?」彼は突き出した。 「私たちが最後に言ったのは毎週5億人のアクティブであり、非常に急速に成長していると思います」とアルトマンは答えました。 「わずか数週間で2倍になったと言った」とアンダーソンは続けた。 「私はそのprivと言いました

PIXTRAL -12B:Mistral AI'の最初のマルチモーダルモデル-Analytics VidhyaPIXTRAL -12B:Mistral AI'の最初のマルチモーダルモデル-Analytics VidhyaApr 13, 2025 am 11:20 AM

導入 Mistralは、最初のマルチモーダルモデル、つまりPixtral-12B-2409をリリースしました。このモデルは、Mistralの120億個のパラメーターであるNemo 12bに基づいて構築されています。このモデルを際立たせるものは何ですか?これで、画像とTexの両方を採用できます

生成AIアプリケーションのエージェントフレームワーク - 分析Vidhya生成AIアプリケーションのエージェントフレームワーク - 分析VidhyaApr 13, 2025 am 11:13 AM

クエリに応答するだけでなく、情報を自律的に収集し、タスクを実行し、テキスト、画像、コードなどの複数のタイプのデータを処理するAIを搭載したアシスタントがいることを想像してください。未来的に聞こえますか?これでa

金融セクターにおける生成AIの応用金融セクターにおける生成AIの応用Apr 13, 2025 am 11:12 AM

導入 金融業界は、効率的な取引と信用の可用性を促進することにより経済成長を促進するため、あらゆる国の発展の基礎となっています。取引の容易さとクレジット

オンライン学習とパッシブアグレッシブアルゴリズムのガイドオンライン学習とパッシブアグレッシブアルゴリズムのガイドApr 13, 2025 am 11:09 AM

導入 データは、ソーシャルメディア、金融取引、eコマースプラットフォームなどのソースから前例のないレートで生成されています。この連続的な情報ストリームを処理することは課題ですが、

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境

SublimeText3 英語版

SublimeText3 英語版

推奨: Win バージョン、コードプロンプトをサポート!

DVWA

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

EditPlus 中国語クラック版

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません