Transformer は 3D モデリングに革命をもたらし、MeshGPT 生成効果はプロのモデラーとネチズンに警告：革新的なアイデア-AI-php.cn

ホームページ

テクノロジー周辺機器

Transformer は 3D モデリングに革命をもたらし、MeshGPT 生成効果はプロのモデラーとネチズンに警告：革新的なアイデア

王林

Nov 29, 2023 pm 02:17 PM

aiモデル

コンピューターグラフィックスの分野では、三角形メッシュは 3D 幾何学オブジェクトを表現する主な方法であり、ゲーム、映画、仮想現実インターフェイスで最も一般的に使用される 3D リソース表現方法でもあります。業界では通常、三角形メッシュを使用して、建物、車両、動物などの複雑なオブジェクトの表面をシミュレートします。同時に、一般的な幾何学的変換、ジオメトリ検出、レンダリング、シェーディング操作も三角形メッシュに基づいて実行する必要があります。

点群やボクセルなどの他の 3D 形状表現と比較すると、三角形メッシュは、より一貫した表面表現を提供します。より制御しやすく、操作が簡単で、よりコンパクトで、最新のレンダリングパイプラインに直接適用できるため、より少ないプリミティブでより高い視覚的品質を実現できます。

# 研究者らはこれまで、ボクセル、点群、ニューラルフィールドなどの表現方法を使用して 3D モデルを生成しようと試みてきました。これらの表現方法も、後処理を通じてメッシュに変換する必要があります。下流のアプリケーションで使用するには、これらの表現方法も必要です。マーチングキューブアルゴリズムを使用した等値面処理など

Transformer は 3D モデリングに革命をもたらし、MeshGPT 生成効果はプロのモデラーとネチズンに警告：革新的なアイデア

残念ながら、このアプローチでは過度に密なメッシュと過度に詳細なメッシュが生成され、過剰なスムージングや等値面化によって発生する凹凸エラーが頻繁に発生します。

3D モデリングの専門家によってモデリングされた 3D メッシュは、より少ない三角形でシャープなディテールを維持しながら、表現がよりコンパクトになります。

Transformer は 3D モデリングに革命をもたらし、MeshGPT 生成効果はプロのモデラーとネチズンに警告：革新的なアイデア

多くの研究者は、3D アセットの作成プロセスをさらに簡素化するために、三角形メッシュを自動的に生成するタスクを解決したいと長い間望んできました。

最近の論文で、研究者らは、メッシュ表現を三角形のセットとして直接生成する新しいソリューション MeshGPT を提案しました。

論文のリンクは、https://nihalsid.github.io/mesh-gpt/static/MeshGPT にあります。 pdf

Transformer は 3D モデリングに革命をもたらし、MeshGPT 生成効果はプロのモデラーとネチズンに警告：革新的なアイデア

Transformer 言語生成モデルに触発され、三角形メッシュを三角形シーケンスに合成する直接シーケンス生成方法を採用しました

パラダイムに従いますテキスト生成の際、研究者は最初に三角形の語彙を学習しました。三角形は潜在的な量子化埋め込みとしてエンコードされていました。学習された三角形の埋め込みが局所的な幾何学的および位相的特徴を保持することを促進するために、グラフ畳み込みエンコーダーを採用します。これらの三角形の埋め込みは、ResNet デコーダによってデコードされ、三角形を表すトークンのシーケンスが処理されて、三角形の頂点座標が生成されます。最後に、研究者らは学習した語彙に基づいて GPT ベースのアーキテクチャをトレーニングし、メッシュを表す一連の三角形を自動的に生成し、鮮明なエッジと高い忠実度という利点を実現しました。

ShapeNet データセットの複数のカテゴリにわたる実験により、MeshGPT は生成された 3D メッシュの品質を大幅に向上させることが示されました。既存の技術と比較して、シェイプカバレッジが平均 9 向上しました。 %、FID スコアは 30 ポイント改善されました。

MeshGPT は、ソーシャルメディアプラットフォームでも白熱した議論を巻き起こしています:

Transformer は 3D モデリングに革命をもたらし、MeshGPT 生成効果はプロのモデラーとネチズンに警告：革新的なアイデア

誰かがかつてこう言いました。これは本当に革命的なアイデアです。」

あるネチズンは、この方法のハイライトは、他の最大の障害を

克服できることだと指摘しました。 3D モデリングのアプローチに重要なのは、編集機能です。 Transformer は 3D モデリングに革命をもたらし、MeshGPT 生成効果はプロのモデラーとネチズンに警告：革新的なアイデア

#1990 年代以来解決されていないすべての問題は、おそらくトランスフォーマーからインスピレーションを得ている可能性があると大胆に予測する人もいます。

Transformer は 3D モデリングに革命をもたらし、MeshGPT 生成効果はプロのモデラーとネチズンに警告：革新的なアイデア

3D/映画制作関連業界に従事するユーザーの中には、自分のキャリアについて懸念を表明した人もいます:

Transformer は 3D モデリングに革命をもたらし、MeshGPT 生成効果はプロのモデラーとネチズンに警告：革新的なアイデア

ただし、論文に掲載されている生成例を見ると、この手法はまだ大規模な応用には至っていないという指摘もありました。プロのモデラーはこれらのメッシュを 5 分以内に作成できます

Transformer は 3D モデリングに革命をもたらし、MeshGPT 生成効果はプロのモデラーとネチズンに警告：革新的なアイデア

#このコメント投稿者は、次のステップは次のステップである可能性があると述べています。 LLM に 3D シードの生成を制御させ、アーキテクチャの自己回帰部分に画像モデルを追加する必要があります。このステップに到達すると、ゲームやその他のシーンの 3D アセットの制作を大規模に自動化できます。

次に、MeshGPT 論文の研究内容を見てみましょう。

手法の概要

大規模言語モデルの進歩に触発されて、研究者らは三角形メッシュを三角形として使用するシーケンスベースの手法を開発しました。シーケンスは自己回帰的に生成されます。この方法では、シャープなエッジと忠実度の高い、クリーンで一貫性のあるコンパクトなメッシュが生成されます。

Transformer は 3D モデリングに革命をもたらし、MeshGPT 生成効果はプロのモデラーとネチズンに警告：革新的なアイデア

研究者らは、三角形をエンコードおよびデコードできるようにするために、まず大きな 3D オブジェクトメッシュから幾何学的な語彙の埋め込みを学習しました。次に、学習された埋め込み語彙に基づいて、グリッド生成用の Transformer がインデックス予測のために自己回帰的な方法でトレーニングされます。

Transformer は 3D モデリングに革命をもたらし、MeshGPT 生成効果はプロのモデラーとネチズンに警告：革新的なアイデア

三角形の語彙を学習するために、研究者らは、グリッドの三角形とその近傍を操作するグラフ畳み込みエンコーダーを使用して、豊富な幾何学的特徴を抽出しました。 3D 形状の複雑な詳細をキャプチャします。これらの特徴は、残差量子化を通じてコードブックへの埋め込みとして量子化され、グリッド表現のシーケンス長を効果的に削減します。ソート後、これらの埋め込まれた情報は、再構成損失に基づいて 1 次元 ResNet によってデコードされます。この段階は、その後の Transformer トレーニングの基礎を築きます。

次に、研究者らはこれらの量子化された幾何学的埋め込みを使用して、GPT に似た純粋なデコーダトランスフォーマをトレーニングしました。これは、メッシュ三角形内の幾何学的エンベディングのシーケンスを抽出し、シーケンス内の次のエンベディングのコードブックインデックスを予測するようにトランスフォーマーをトレーニングすることによってこれを行います。

トレーニング後、トランスフォーマーは自己回帰的にサンプリングして、埋め込みシーケンスを予測し、これらの埋め込みをデコードして、人間が描いたメッシュに似た効率的で不規則な三角形を示す斬新で多様なメッシュ構造を生成します。

Transformer は 3D モデリングに革命をもたらし、MeshGPT 生成効果はプロのモデラーとネチズンに警告：革新的なアイデア

#MeshGPT は、グラフ畳み込みエンコーダを使用してメッシュサーフェスを処理し、幾何学的近傍情報を使用して 3D をキャプチャして表現します。複雑な形状の詳細の強い特徴は、残差量子化方法を使用してコードブック埋め込みに量子化されます。このアプローチにより、単純なベクトル量子化と比較して、より優れた再構成品質が保証されます。 MeshGPT は、再構成損失に基づいて、ResNet 経由で量子化された埋め込みをソートし、デコードします。

Transformer は 3D モデリングに革命をもたらし、MeshGPT 生成効果はプロのモデラーとネチズンに警告：革新的なアイデア

この調査では、Transformer モデルを使用して、事前トレーニングされたコードブック語彙ライブラリからトークンインデックスとしてグリッドシーケンスを生成します。トレーニング中に、画像エンコーダーはメッシュサーフェスから特徴を抽出し、それらを一連のサーフェスエンベディングに量子化します。これらの埋め込みはタイル化され、開始トークンと終了トークンでマークされてから、上記の GPT タイプの Transformer モデルに供給されます。デコーダはクロスエントロピー損失を使用して最適化され、各埋め込みの後続のコードブックインデックスを予測します。

実験結果

この研究では、MeshGPT と共通の比較実験は、次のようなメッシュ生成方法で実施されました。

BSPNet は凸分解によるメッシュを表し、

##AtlasNet は 3D メッシュを複数の 2D 平面の変形として表します。
さらに、この研究では MeshGPT と神経場ベースの SOTA メソッド GET3D を比較しました。

図 6、図 7、表 1 に示すように、MeshGPT は 4 つのカテゴリすべてでベースライン手法を上回っています。 MeshGPT は、より細かい幾何学的詳細を備えたシャープでコンパクトなメッシュを生成できます。

具体的には、Polygen と比較して、MeshGPT はより複雑な詳細を含む形状を生成でき、Polygen は推論プロセス中にエラーが蓄積する可能性が高くなります。AtlasNet は折り畳みアーティファクトに悩まされることがよくあります)。多様性が低く、形状品質が低い; 平面 BSP ツリーを使用する BSPNet は、異常な三角形分割パターンを持つブロック状の形状を生成する傾向があります; GET3D は、優れた高レベルの形状構造を生成しますが、三角形が多すぎて不完全な平面があります。＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃に示すように表 2 に示すように、この研究ではユーザーが MeshGPT によって生成されたメッシュの品質を評価することもでき、MeshGPT は形状と三角形分割の品質の点で AtlasNet、Polygen、BSPNet を大幅に上回りました。ほとんどのユーザーは、GET3D よりも MeshGPT によって生成された形状品質 (68%) と三角形分割品質 (73%) を好みました。 Transformer は 3D モデリングに革命をもたらし、MeshGPT 生成効果はプロのモデラーとネチズンに警告：革新的なアイデア

#書き換えられた内容は次のとおりです: 新しい形状。図 8 に示すように、MeshGPT はトレーニングデータセットを超えた新しい形状を生成でき、モデルが単に既存の形状を取得する以上のことを行うことができます。

Transformer は 3D モデリングに革命をもたらし、MeshGPT 生成効果はプロのモデラーとネチズンに警告：革新的なアイデア形状の完成。以下の図 9 に示すように、MeshGPT は、指定されたローカル形状に基づいて複数の可能な補完を推測し、複数の形状仮説を生成することもできます。

Transformer は 3D モデリングに革命をもたらし、MeshGPT 生成効果はプロのモデラーとネチズンに警告：革新的なアイデア

以上がTransformer は 3D モデリングに革命をもたらし、MeshGPT 生成効果はプロのモデラーとネチズンに警告：革新的なアイデアの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

Gemma Scope：AI＆＃039;の思考プロセスを覗くためのGoogle＆＃039;の顕微鏡Apr 17, 2025 am 11:55 AM

ジェマの範囲で言語モデルの内部の仕組みを探る AI言語モデルの複雑さを理解することは、重要な課題です。包括的なツールキットであるGemma ScopeのGoogleのリリースは、研究者に掘り下げる強力な方法を提供します

ビジネスインテリジェンスアナリストは誰で、どのようになるか？Apr 17, 2025 am 11:44 AM

ビジネスの成功のロック解除：ビジネスインテリジェンスアナリストになるためのガイド生データを組織の成長を促進する実用的な洞察に変換することを想像してください。これはビジネスインテリジェンス（BI）アナリストの力です - GUにおける重要な役割

SQLに列を追加する方法は？ - 分析VidhyaApr 17, 2025 am 11:43 AM

SQLの変更テーブルステートメント：データベースに列を動的に追加するデータ管理では、SQLの適応性が重要です。その場でデータベース構造を調整する必要がありますか？ Alter Tableステートメントはあなたの解決策です。このガイドの詳細は、コルを追加します

ビジネスアナリストとデータアナリストApr 17, 2025 am 11:38 AM

導入 2人の専門家が重要なプロジェクトで協力している賑やかなオフィスを想像してください。ビジネスアナリストは、会社の目標に焦点を当て、改善の分野を特定し、市場動向との戦略的整合を確保しています。シム

ExcelのCountとCountaとは何ですか？ - 分析VidhyaApr 17, 2025 am 11:34 AM

Excelデータカウントと分析：カウントとカウントの機能の詳細な説明特に大規模なデータセットを使用する場合、Excelでは、正確なデータカウントと分析が重要です。 Excelは、これを達成するためにさまざまな機能を提供し、CountおよびCounta関数は、さまざまな条件下でセルの数をカウントするための重要なツールです。両方の機能はセルをカウントするために使用されますが、設計ターゲットは異なるデータ型をターゲットにしています。 CountおよびCounta機能の特定の詳細を掘り下げ、独自の機能と違いを強調し、データ分析に適用する方法を学びましょう。キーポイントの概要カウントとcouを理解します

ChromeはAIと一緒にここにいます：毎日何か新しいことを体験してください!!Apr 17, 2025 am 11:29 AM

Google Chrome'sAI Revolution：パーソナライズされた効率的なブラウジングエクスペリエンス人工知能（AI）は私たちの日常生活を急速に変換しており、Google ChromeはWebブラウジングアリーナで料金をリードしています。この記事では、興奮を探ります

ai＆＃x27; s Human Side：Wellbeing and the Quadruple bottuntApr 17, 2025 am 11:28 AM

インパクトの再考：四重材のボトムライン長い間、会話はAIの影響の狭い見方に支配されており、主に利益の最終ラインに焦点を当てています。ただし、より全体的なアプローチは、BUの相互接続性を認識しています

5ゲームを変える量子コンピューティングの使用ケースあなたが知っておくべきであるApr 17, 2025 am 11:24 AM

物事はその点に向かって着実に動いています。量子サービスプロバイダーとスタートアップに投資する投資は、業界がその重要性を理解していることを示しています。そして、その価値を示すために、現実世界のユースケースの数が増えています

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。