検索
ホームページテクノロジー周辺機器AI北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現

写真を 3D に変換するのにかかる時間は 2 分です。

それは依然として、高いテクスチャ品質と複数の視野角での高い一貫性を備えた種類です。

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現

どんな種類であっても、入力時のシングルビュー画像は次のようになります。

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現

Two数分後、3D バージョンが完成します:

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現##△上、Repaint123 (
NeRF

); 下、Repaint123 (GS)新しいメソッドは

Repaint123

と呼ばれます。中心となるアイデアは、2D 拡散モデルの強力な画像生成機能と再ペイント戦略のテクスチャ位置合わせ機能を組み合わせて、高品質で一貫した画像を生成することです。多視点からのイメージ。 さらに、この研究では、重複領域に対する可視性を考慮した適応型再ペイント強度手法も導入しています。

Repaint123は、これまでの多視点ずれが大きい、テクスチャの劣化、生成の遅さなどの問題点を一気に解決しました。

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現# プロジェクト コードはまだ GitHub で公開されていませんが、100 人がコードをマークするために来ています:

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現# # Repaint123 はどのようなものですか?

これまで、画像を 3D に変換する方法には、スコア蒸留サンプリング (SDS) が一般的に使用されていました。この方法の結果は素晴らしいものですが、マルチビューの不一致、過飽和、過度に平滑化されたテクスチャ、生成の遅さなど、いくつかの問題があります。

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現△上からinput、Zero123-XL、Magic123、Dream gaussian

これらの問題を解決するために、北京大学と彭城研究所から、シンガポール国立大学、武漢大学の研究者は Repaint123 を提案しました。

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現一般に、Repaint123 には次のような貢献があります。

(1) Repaint123 は、画像から 3D への制御可能な再描画プロセスを包括的に考慮して生成します。高品質の画像シーケンスを生成し、これらの画像が複数の視野角にわたって一貫していることを確認します。

(2) Repaint123 は、シングルビュー 3D 生成のための単純なベースライン方法を提案しました。

大まかなモデルの段階では、Zero123 を 3D プリアとして使用し、SDS 損失関数と組み合わせて、ガウス スプラッティング ジオメトリを最適化することで大まかな 3D モデルを迅速に生成します (わずか 1 分)。

細かいモデルの段階では、2D プリアとして安定拡散を使用し、平均二乗誤差 (MSE) 損失関数と組み合わせて、メッシュ テクスチャ (これも 1 つだけ) を迅速に調整することで高品質の 3D モデルを生成します。分)。

(3) 多数の実験により、Repaint123 メソッドの有効性が証明されています。 1枚の画像からわずか2分で2D生成品質に匹敵する高品質な3Dコンテンツを生成できます。

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現△一貫性のある高品質な 3D のシングルビュー 3D 高速生成を実現

具体的な方法を見ていきましょう。

Repaint123 はメッシュ改良段階の最適化に焦点を当てており、その主な改善方向は、マルチビューの一貫性を備えた高品質のイメージ シーケンスの生成と、高速かつ高品質の 3D 再構成の達成という 2 つの側面をカバーしています。

1. 複数視点の一貫性のある高画質画像シーケンスの生成

複数視点の一貫性のある高画質画像シーケンスの生成は、次の 3 つに分けられます。パーツ:

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現△複数の視点からの一貫した画像生成プロセス

DDIM 反転

ラフモデル段階での生成一貫した 3D 低周波テクスチャ情報を取得するために、作者は DDIM 反転を使用して画像を決定された潜在空間に反転し、その後のノイズ除去プロセスの基礎を築き、忠実で一貫した画像を生成します。

制御可能なノイズ除去

ノイズ除去段階で幾何学的一貫性と長距離テクスチャ一貫性を制御するために、著者は ControlNet を導入し、幾何学的事前分布として粗いモデルによってレンダリングされた深度マップを使用し、同時に、テクスチャ マイグレーションのリファレンス マップ。

さらに、分類子を使用しないガイダンスを実行して画質を向上させるために、この論文では CLIP を使用して参照画像を画像キューにエンコードし、ノイズ除去ネットワークをガイドします。

再描画

オクルージョンと重複部分のプログレッシブ再描画 画像シーケンス内の隣接する画像の重複領域がピクセル レベルで位置合わせされるようにするために、作成者はプログレッシブ ローカルを使用します。戦略を再描画します。

重なり合う領域はそのままに、調和のとれた隣接領域が生成され、基準視点から360°まで徐々に広がります。

しかし、以下の図に示すように、正視時には以前に斜視されていた領域の視覚解像度が大きくなり、より多くの高周波情報が必要になるため、著者は重複領域も調整する必要があることを発見しました。追加される。

さらに、間引き強度は 1-cosθ* に等しくなります。ここで、θ* は、以前のすべてのカメラ アングルと、表示された表面の法線ベクトルを使用して、重なり合う領域を適応的に再描画します。

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現△カメラアングルと間引き強度の関係

品質を向上させながら忠実度を確保するための適切な間引き強度を選択するために、著者は以下から教訓を得ています。射影定理と画像超解像度の考え方に基づいて、重複領域を洗練するためのシンプルかつ直接的な可視性を意識した再描画戦略が提案されています。

2. 高速かつ高品質な 3D 再構成

下の図に示すように、著者は高速かつ高品質な 3D 再構成のプロセスで 2 つの方法を使用します。 . ステージアプローチ。

#△Repaint123 2 段階シングルビュー 3D 生成フレームワーク北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現
まず、ガウス スプラッティング表現を利用して、合理的な幾何学的構造と粗いテクスチャを迅速に生成します。

同時に、以前に生成されたマルチビューの一貫した高品質画像シーケンスの助けを借りて、作成者は単純な平均二乗誤差

(MSE)

損失を使用して、高速な 3D テクスチャ再構築。

一貫性、品質、速度の最適化

研究者は、単一ビュー生成タスクの複数のアプローチを比較しました。

△シングルビュー 3D 生成視覚化の比較北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現
RealFusion15 および Test-alpha データ セットでは、Repaint123 は一貫性、品質、速度の 3 つの結果を達成しました。パフォーマンス面で最も先進的なエフェクト。

#同時に、著者は論文で使用されている各モジュールの有効性と視点回転の増分に関するアブレーション実験も実施しました。

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現

##視野角間隔が 60 度の場合に性能がピークに達しますが、視野角間隔が広すぎると重なり合う面積が減少し、故障の可能性が高まることも分かりました。問題は多面的であるため、40 度を最適な視野角間隔として使用できます。

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現
北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現

論文アドレス: https://arxiv.org/pdf/2312.13271.pdf

コード アドレス: https:// pku-yuangroup.github.io/repaint123/北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現

プロジェクトアドレス: https://pku-yuangroup.github.io/repaint123/

以上が北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
Gemma Scope:AI'の思考プロセスを覗くためのGoogle'の顕微鏡Gemma Scope:AI'の思考プロセスを覗くためのGoogle'の顕微鏡Apr 17, 2025 am 11:55 AM

ジェマの範囲で言語モデルの内部の仕組みを探る AI言語モデルの複雑さを理解することは、重要な課題です。 包括的なツールキットであるGemma ScopeのGoogleのリリースは、研究者に掘り下げる強力な方法を提供します

ビジネスインテリジェンスアナリストは誰で、どのようになるか?ビジネスインテリジェンスアナリストは誰で、どのようになるか?Apr 17, 2025 am 11:44 AM

ビジネスの成功のロック解除:ビジネスインテリジェンスアナリストになるためのガイド 生データを組織の成長を促進する実用的な洞察に変換することを想像してください。 これはビジネスインテリジェンス(BI)アナリストの力です - GUにおける重要な役割

SQLに列を追加する方法は? - 分析VidhyaSQLに列を追加する方法は? - 分析VidhyaApr 17, 2025 am 11:43 AM

SQLの変更テーブルステートメント:データベースに列を動的に追加する データ管理では、SQLの適応性が重要です。 その場でデータベース構造を調整する必要がありますか? Alter Tableステートメントはあなたの解決策です。このガイドの詳細は、コルを追加します

ビジネスアナリストとデータアナリストビジネスアナリストとデータアナリストApr 17, 2025 am 11:38 AM

導入 2人の専門家が重要なプロジェクトで協力している賑やかなオフィスを想像してください。 ビジネスアナリストは、会社の目標に焦点を当て、改善の分野を特定し、市場動向との戦略的整合を確保しています。 シム

ExcelのCountとCountaとは何ですか? - 分析VidhyaExcelのCountとCountaとは何ですか? - 分析VidhyaApr 17, 2025 am 11:34 AM

Excelデータカウントと分析:カウントとカウントの機能の詳細な説明 特に大規模なデータセットを使用する場合、Excelでは、正確なデータカウントと分析が重要です。 Excelは、これを達成するためにさまざまな機能を提供し、CountおよびCounta関数は、さまざまな条件下でセルの数をカウントするための重要なツールです。両方の機能はセルをカウントするために使用されますが、設計ターゲットは異なるデータ型をターゲットにしています。 CountおよびCounta機能の特定の詳細を掘り下げ、独自の機能と違いを強調し、データ分析に適用する方法を学びましょう。 キーポイントの概要 カウントとcouを理解します

ChromeはAIと一緒にここにいます:毎日何か新しいことを体験してください!!ChromeはAIと一緒にここにいます:毎日何か新しいことを体験してください!!Apr 17, 2025 am 11:29 AM

Google Chrome'sAI Revolution:パーソナライズされた効率的なブラウジングエクスペリエンス 人工知能(AI)は私たちの日常生活を急速に変換しており、Google ChromeはWebブラウジングアリーナで料金をリードしています。 この記事では、興奮を探ります

ai' s Human Side:Wellbeing and the Quadruple bottuntai' s Human Side:Wellbeing and the Quadruple bottuntApr 17, 2025 am 11:28 AM

インパクトの再考:四重材のボトムライン 長い間、会話はAIの影響の狭い見方に支配されており、主に利益の最終ラインに焦点を当てています。ただし、より全体的なアプローチは、BUの相互接続性を認識しています

5ゲームを変える量子コンピューティングの使用ケースあなたが知っておくべきである5ゲームを変える量子コンピューティングの使用ケースあなたが知っておくべきであるApr 17, 2025 am 11:24 AM

物事はその点に向かって着実に動いています。量子サービスプロバイダーとスタートアップに投資する投資は、業界がその重要性を理解していることを示しています。そして、その価値を示すために、現実世界のユースケースの数が増えています

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

AtomエディタMac版ダウンロード

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

SecLists

SecLists

SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

VSCode Windows 64 ビットのダウンロード

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター