検索
ホームページテクノロジー周辺機器AI神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります

超高解像度は、高品質の画像やビデオを記録および表示するための標準として多くの研究者に歓迎されています。低解像度 (1K HD フォーマット) と比較して、高解像度でキャプチャされたシーンは、通常、細部が非常に鮮明です。クリアで、ピクセル情報は小さなパッチによって増幅されます。しかし、この技術を画像処理やコンピュータビジョンに応用するにはまだ多くの課題があります。

この記事では、Alibaba の研究者が新しいビュー合成タスクに焦点を当て、4K-NeRF と呼ばれるフレームワークを提案します。その NeRF ベースのボリューム レンダリング メソッドは、高忠実度のビュー合成で実装できます。 4K超高解像度で。

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります

文書アドレス: https://arxiv.org/abs/2212.04701

プロジェクトのホームページ: https://github.com/frozoul/4K-NeRF

早速、最初に効果を見てみましょう (以下)ビデオはダウンサンプリングされています。元の 4K ビデオについては、元のプロジェクトを参照してください)。

方法

次に、この調査がどのように実施されたかを見てみましょう。

4K-NeRF パイプライン (以下に示すように): パッチベースのレイ サンプリング テクノロジーを使用して、低解像度で VC-Encoder (View-Consistent) (DEVO ベース) を共同トレーニングします。 - 次元の幾何学情報は空間内でエンコードされ、VC-Decoder を通過して、高周波、精細かつ高品質のレンダリングと強化されたビューの一貫性を実現します。

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります

この研究では、DVGO [32] で定義された式に基づいてエンコーダをインスタンス化し、学習されたボクセル グリッドベースの表現は、明示的に地理的にエンコードされたジオメトリです。 :

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります

各サンプリング ポイントについて、密度推定値の三線形補間には、体積密度値を生成するためのソフトプラス アクティベーション関数が装備されています:

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります

# 色は小規模な MLP を使用して推定されます:

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります

このように、設定した直線 r に沿ってサンプリング点の特性を累積することで、各レイ (またはピクセル) の特性値を取得できます。

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります

VC エンコーダーに埋め込まれた幾何学的特性をより有効に活用するために、この研究では、サンプリングされた光線軸に沿って各光線 r の深さを推定することによって深度マップも生成しました。推定された深度マップは、上記のエンコーダーによって生成されたシーンの 3 次元構造への強力なガイドを提供します。ブロック (ノンパラメトリック正規化でもダウンサンプリング操作でもない) とインターリーブされたアップサンプリング操作を使用して構築されています。特に、この研究では、特徴 F と深度マップ M を単純に連結するのではなく、深度マップ内の深度信号を結合し、学習された変換を通じて各ブロックにそれを注入して、ブロックのアクティベーションを調整します。

従来の NeRF 手法におけるピクセル レベルのメカニズムとは異なり、この研究の手法は光線 (ピクセル) 間の空間情報を捕捉することを目的としています。したがって、NeRF でのランダムなレイ サンプリングの戦略はここでは適切ではありません。したがって、この研究では、光線特徴間の空間依存性の捕捉を容易にするパッチベースの光線サンプリング トレーニング戦略を提案します。トレーニング中に、トレーニング ビューの画像はまずサイズ N_p × N_p のパッチ p に分割され、ピクセルのサンプリング確率が均一になるようにします。画像空間の次元をパッチ サイズで正確に分割できない場合、トレーニング パッチのセットを取得するには、エッジまでパッチを切り詰める必要があります。次に、セットから 1 つ (または複数) のパッチがランダムに選択され、パッチ内のピクセルの光線が反復ごとにミニバッチを形成します。

細かい部分の視覚効果がぼやけたり平滑化しすぎたりする問題を解決するために、この研究では、敵対的損失と知覚損失を追加して、細かい部分の合成を正規化します。知覚損失神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにありますは、事前トレーニングされた 19 層 VGG ネットワークを介して、予測パッチ神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります と特徴空間内の真の値 p の間の類似性を推定します。

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります

##この研究では、MSE の代わりに 神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります損失を使用して、高周波の詳細の再構成を監視します。

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります

さらに、この研究では補助的な MSE 損失も追加されており、最終的な総損失関数の形式は次のとおりです。

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります実験効果

定性分析##実験では 4K を比較します。 NeRF を他のモデルと比較すると、通常の NeRF に基づく方法では、さまざまな程度のディテールの損失とぼやけがあることがわかります。対照的に、4K-NeRF は、トレーニングの視野が限られているシーンであっても、これらの複雑で高周波のディテールの高品質でフォトリアリスティックなレンダリングを実現します。 #################################定量分析###############この研究は、Plenoxels、DVGO、JaxNeRF、MipNeRF-360、NeRF-SR などの 4k データに基づくいくつかの現在の手法と比較されます。この実験では、画像回復の評価指標を比較として使用するだけでなく、総合的な評価の参考として推論時間やキャッシュメモリも提供します。結果は次のとおりです。

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります結果は、一部の指標では一部のメソッドの結果とそれほど変わりませんが、ボクセルの利点が得られます。効率とメモリ コストの両方の点で驚異的なパフォーマンスが達成され、4K 画像を 300 ミリ秒でレンダリングできます。

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります

概要と今後の展望

この研究では、微細なディテールをモデリングする際の NeRF の機能を調査し、非常に高い解像度でシーン内のビューを復元する能力を強化する新しいフレームワークを提案します 微細なディテールの一貫した表現力。さらに、この研究では、幾何学的一貫性を維持し、低位空間での幾何学特性を効果的にモデル化し、幾何学を認識した特徴間の局所相関を利用してフルスケール空間でのビューを実現する、エンコーダ/デコーダ モジュールのペアも導入されています。ベースのサンプリング トレーニング フレームワークにより、パーセプトロン指向の正則化による監視を統合する方法も可能になります。この研究では、フレームワークの効果を動的シーン モデリングと、将来の方向性としてニューラル レンダリング タスクに組み込むことを望んでいます。

以上が神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにありますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
Gemma Scope:AI'の思考プロセスを覗くためのGoogle'の顕微鏡Gemma Scope:AI'の思考プロセスを覗くためのGoogle'の顕微鏡Apr 17, 2025 am 11:55 AM

ジェマの範囲で言語モデルの内部の仕組みを探る AI言語モデルの複雑さを理解することは、重要な課題です。 包括的なツールキットであるGemma ScopeのGoogleのリリースは、研究者に掘り下げる強力な方法を提供します

ビジネスインテリジェンスアナリストは誰で、どのようになるか?ビジネスインテリジェンスアナリストは誰で、どのようになるか?Apr 17, 2025 am 11:44 AM

ビジネスの成功のロック解除:ビジネスインテリジェンスアナリストになるためのガイド 生データを組織の成長を促進する実用的な洞察に変換することを想像してください。 これはビジネスインテリジェンス(BI)アナリストの力です - GUにおける重要な役割

SQLに列を追加する方法は? - 分析VidhyaSQLに列を追加する方法は? - 分析VidhyaApr 17, 2025 am 11:43 AM

SQLの変更テーブルステートメント:データベースに列を動的に追加する データ管理では、SQLの適応性が重要です。 その場でデータベース構造を調整する必要がありますか? Alter Tableステートメントはあなたの解決策です。このガイドの詳細は、コルを追加します

ビジネスアナリストとデータアナリストビジネスアナリストとデータアナリストApr 17, 2025 am 11:38 AM

導入 2人の専門家が重要なプロジェクトで協力している賑やかなオフィスを想像してください。 ビジネスアナリストは、会社の目標に焦点を当て、改善の分野を特定し、市場動向との戦略的整合を確保しています。 シム

ExcelのCountとCountaとは何ですか? - 分析VidhyaExcelのCountとCountaとは何ですか? - 分析VidhyaApr 17, 2025 am 11:34 AM

Excelデータカウントと分析:カウントとカウントの機能の詳細な説明 特に大規模なデータセットを使用する場合、Excelでは、正確なデータカウントと分析が重要です。 Excelは、これを達成するためにさまざまな機能を提供し、CountおよびCounta関数は、さまざまな条件下でセルの数をカウントするための重要なツールです。両方の機能はセルをカウントするために使用されますが、設計ターゲットは異なるデータ型をターゲットにしています。 CountおよびCounta機能の特定の詳細を掘り下げ、独自の機能と違いを強調し、データ分析に適用する方法を学びましょう。 キーポイントの概要 カウントとcouを理解します

ChromeはAIと一緒にここにいます:毎日何か新しいことを体験してください!!ChromeはAIと一緒にここにいます:毎日何か新しいことを体験してください!!Apr 17, 2025 am 11:29 AM

Google Chrome'sAI Revolution:パーソナライズされた効率的なブラウジングエクスペリエンス 人工知能(AI)は私たちの日常生活を急速に変換しており、Google ChromeはWebブラウジングアリーナで料金をリードしています。 この記事では、興奮を探ります

ai' s Human Side:Wellbeing and the Quadruple bottuntai' s Human Side:Wellbeing and the Quadruple bottuntApr 17, 2025 am 11:28 AM

インパクトの再考:四重材のボトムライン 長い間、会話はAIの影響の狭い見方に支配されており、主に利益の最終ラインに焦点を当てています。ただし、より全体的なアプローチは、BUの相互接続性を認識しています

5ゲームを変える量子コンピューティングの使用ケースあなたが知っておくべきである5ゲームを変える量子コンピューティングの使用ケースあなたが知っておくべきであるApr 17, 2025 am 11:24 AM

物事はその点に向かって着実に動いています。量子サービスプロバイダーとスタートアップに投資する投資は、業界がその重要性を理解していることを示しています。そして、その価値を示すために、現実世界のユースケースの数が増えています

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

EditPlus 中国語クラック版

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール