AR、VR、3D プリント、シーン構築、映画制作などの多くの分野において、服を着た人体の高品質 3D モデルは非常に重要です。
従来のモデル作成方法では多くの時間がかかり、専門の機器と技術者のみが完成させることができます。
# 逆に、日常生活では携帯電話のカメラをよく使います。またはウェブ上で見つけたポートレート写真。
したがって、単一の画像から 3D 人体モデルを正確に再構築できる方法は、コストを大幅に削減し、独自の作成プロセスを簡素化することができます。
以前の方法 (左) とこの方法 (右) の技術的ルートの比較
3D 人体再構成のための以前の深度学習モデルには、多くの場合、画像から 2D 特徴を抽出し、2D 特徴を 3D 空間に転送し、人体再構築に 3D 特徴を使用するという 3 つのステップが必要です。
しかし、これらの方法では、2D 特徴を 3D 空間に変換する段階で人体の事前分布の導入が無視されることが多く、その結果、特徴抽出が不十分になり、最終的な再構成結果にさまざまな欠陥が生じます。
SIFU と他の SOTA モデルの再構築効果の比較
また、ステージでは以前は、モデルはトレーニング セットで学習した知識のみに依存しており、現実世界の事前知識が不足していたため、目に見えない領域でのテクスチャ予測が不十分になることがよくありました。
写真
#モデル構造
モデル パイプラインは次のとおりです:
写真
モデルの操作は 2 つの段階に分かれており、第 1 段階ではサイド陰関数を使用して人体の形状 (メッシュ) と粗いテクスチャ (粗いテクスチャ) を再構築します。ステージでは、事前トレーニングされた拡散モデルを使用してテクスチャを調整します。
第一段階では、著者は独自のサイドビュー デカップリング トランスを設計し、グローバル エンコーダを通じて 2D 特徴を抽出した後、人体の事前モデル SMPL- をデコーダに導入しました。側面図
この方法では、2D フィーチャを 3D 空間に変換する際に人体の事前知識をうまく組み合わせることができ、モデルの再構成効果が向上します。
第 2 段階では、著者は 3D 一貫したテクスチャ洗練プロセスを提案します。まず、人体の目に見えない領域 (側面と背中) を、次のような画像のコレクションに区別できます。連続的な視野角を設定し、大量のデータから事前知識を学習する拡散モデルの助けを借りて、粗いテクスチャの画像を一貫して編集して、より洗練された結果を得ることができます。最後に、リファイン前後の画像から損失を計算することで、3D モデルのテクスチャ マップが最適化されます。
実験部分
より高い再構成精度
実験部分では、著者は包括的な彼らのモデルは、CAPE-NFP、CAPE-FP、THuman2.0 などのさまざまなテスト セットでテストされ、主要な会議で発表された以前の単一画像人体再構成 SOTA モデルと比較されました。定量的テストの後、SIFU モデルは幾何学的再構成とテクスチャ再構成の両方で最良の結果を示しました。
#幾何学再構成精度の定量的評価
テクスチャ再構築効果の定量的評価
インターネット上の公開画像を入力として使用して、定性的な効果を実証します
##より強力な堅牢性
以前の場合トレーニングセット以外のデータにモデルを適用すると、推定人体事前モデルSMPL/SMPL-Xの精度が十分ではないため、再構成結果が入力画像と大きく異なることが多く、実用化が困難になる。
この点に関して、著者は特にモデルの堅牢性をテストしました。事前のモデル パラメーターのグラウンド トゥルースに摂動を追加することで、実際のシーンをシミュレートするためにポーズがシフトされました。SMPL-X不正確な状況を推定してモデル再構成の精度を評価します。結果は、この場合でも SIFU モデルが依然として最高の再構成精度を持っていることを示しています。
#エラーのある人体の以前のモデルに直面した場合のモデルの堅牢性を評価します
現実世界の画像を使用することで、以前の人体モデルの推定が不正確な場合でも、SIFU はより優れた再構築効果を実現します
より広範なアプリケーション シナリオ
SIFU モデルの高精度かつ高品質な再構成効果により、3D プリント、シーン構築、テクスチャ編集などのさまざまなアプリケーション シナリオに適しています。
#3D プリント SIFU 再構成人体モデル
##SIFU は 3D シーンの構築に使用されます
この記事では、サイドビューの条件付き暗黙関数と 3D 一貫性のあるテクスチャ編集を提案します。これは、2D フィーチャを 3D 空間に変換し、テクスチャを予測する際に、以前の研究で導入された事前知識の欠点を克服し、単一の画像内での人体再構成の精度と効果を大幅に向上させ、モデルに実際の大きな利点を与えます。 -世界のアプリケーション、そしてまた、この分野の将来の研究に新しいアイデアを提供します。
参考:
https://arxiv.org/abs/2312.06704
以上が浙江大学が新しいSOTA技術SIFUを提案:たった1枚の写真で高品質の3D人体モデルを再構築可能の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

Microsoft PowerBIチャートでデータ視覚化の力を活用する 今日のデータ駆動型の世界では、複雑な情報を非技術的な視聴者に効果的に伝えることが重要です。 データの視覚化は、このギャップを橋渡しし、生データを変換するi

エキスパートシステム:AIの意思決定力に深く飛び込みます 医療診断から財務計画まで、あらゆることに関する専門家のアドバイスにアクセスできることを想像してください。 それが人工知能の専門家システムの力です。 これらのシステムはプロを模倣します

まず第一に、これがすぐに起こっていることは明らかです。さまざまな企業が、現在AIによって書かれているコードの割合について話しており、これらは迅速なクリップで増加しています。すでに多くの仕事の移動があります

映画業界は、デジタルマーケティングからソーシャルメディアまで、すべてのクリエイティブセクターとともに、技術的な岐路に立っています。人工知能が視覚的なストーリーテリングのあらゆる側面を再構築し始め、エンターテイメントの風景を変え始めたとき

ISROの無料AI/MLオンラインコース:地理空間技術の革新へのゲートウェイ インド宇宙研究機関(ISRO)は、インドのリモートセンシング研究所(IIRS)を通じて、学生と専門家に素晴らしい機会を提供しています。

ローカル検索アルゴリズム:包括的なガイド 大規模なイベントを計画するには、効率的なワークロード分布が必要です。 従来のアプローチが失敗すると、ローカル検索アルゴリズムは強力なソリューションを提供します。 この記事では、Hill ClimbingとSimulについて説明します

このリリースには、GPT-4.1、GPT-4.1 MINI、およびGPT-4.1 NANOの3つの異なるモデルが含まれており、大規模な言語モデルのランドスケープ内のタスク固有の最適化への動きを示しています。これらのモデルは、ようなユーザー向けインターフェイスをすぐに置き換えません

Chip Giant Nvidiaは、月曜日に、AI Supercomputersの製造を開始すると述べました。これは、大量のデータを処理して複雑なアルゴリズムを実行できるマシンを初めて初めて米国内で実行します。発表は、トランプSI大統領の後に行われます


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

MantisBT
Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

SAP NetWeaver Server Adapter for Eclipse
Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

VSCode Windows 64 ビットのダウンロード
Microsoft によって発売された無料で強力な IDE エディター

SublimeText3 英語版
推奨: Win バージョン、コードプロンプトをサポート!

ZendStudio 13.5.1 Mac
強力な PHP 統合開発環境
