検索
ホームページテクノロジー周辺機器AIXiaozhaはたくさんのお金を使いました! Meta はメタバース専用の AI モデルを開発しました

人工知能は仮想世界のバックボーンとなるでしょう。

人工知能は、コンピューター ビジョン、自然言語処理、ブロックチェーン、デジタル ツインなど、メタバース内のさまざまな関連テクノロジと組み合わせることができます。

Xiaozhaはたくさんのお金を使いました! Meta はメタバース専用の AI モデルを開発しました

#2 月、ザッカーバーグ氏は、同社初の仮想イベント「Inside The Lab」でメタバースがどのようなものになるかを披露しました。同氏によると、同社はユーザーが説明するだけで独自の仮想現実アバターを生成できる、新しい一連の生成AIモデルを開発しているという。

ザッカーバーグ氏は、ユーザーが音声アシスタントとより自然にコミュニケーションできるようにするオンデバイス音声アシスタントを構築するための完全なエンドツーエンドのニューラル モデルである Project CAIRaoke など、今後の一連のプロジェクトを発表しました。一方、Meta は、すべての言語に音声から音声への直接翻訳を提供するユニバーサル音声翻訳機の構築に熱心に取り組んでいます。

数か月後、メタは約束を果たしました。ただし、ゲーム内でスキンを持っているテクノロジー企業はメタ社だけではありません。 NVIDIA などの企業も、より豊かなメタバース エクスペリエンスを提供するために、独自に開発した AI モデルをリリースしています。

Xiaozhaはたくさんのお金を使いました! Meta はメタバース専用の AI モデルを開発しました

オープンソースの事前トレーニング済み Transformer (OPT-1,750 億パラメータ)

GAN verse 3D

GANverse 3D は NVIDIA AI によって開発されました研究とは、深層学習を使用して 2D 画像を 3D アニメーション バージョンに処理するモデルであり、昨年 ICLR と CVPR で発表された研究論文で説明されているツールであり、シミュレーションをより高速かつ低コストで作成できます。

このモデルは、StyleGAN を使用して、単一の画像から複数のビューを自動的に生成します。このアプリケーションを NVIDIA Omniverse の拡張機能としてインポートすると、仮想世界で 3D オブジェクトを正確にレンダリングできます。 NVIDIA が立ち上げた Omniverse は、ユーザーが仮想環境で最終的なアイデアのシミュレーションを作成するのに役立ちます。

3D モデルの作成は、メタバースを構築する際の重要な要素となっています。 Nike や Forever21 などの小売業者は、電子商取引の売上を促進するためにメタバースに仮想店舗を開設しました。

Visual Acoustic Matching Model (AViTAR)

Xiaozhaはたくさんのお金を使いました! Meta はメタバース専用の AI モデルを開発しました

Meta の Reality Lab チームはテキサス大学と協力して、サウンドを改善するための人工知能モデルを構築しました。メタスペースの品質。このモデルは、シーン内のオーディオとビデオを一致させるのに役立ちます。オーディオ クリップを変換して、特定の環境で録音されたかのように聞こえます。このモデルは、ランダムなオンラインビデオからデータを抽出した後、自己教師あり学習を使用します。理想的には、ユーザーは AR グラスでお気に入りの思い出を表示し、実際の体験によって生成された正確な音を聞くことができる必要があります。

Meta AI は、他の 2 つの音響モデルとともに AViTAR をオープン ソースとしてリリースしました。サウンドがメタバース エクスペリエンスで見落とされがちな部分であることを考えると、これは非常にまれなことです。

Visually Impacted Vibration Reduction (VIDA)

Meta AI によってリリースされた 2 番目の音響モデルは、音響の残響を除去するために使用されます。

Xiaozhaはたくさんのお金を使いました! Meta はメタバース専用の AI モデルを開発しました

モデルは、住宅の 3D モデルからのさまざまなリアルなオーディオ レンダリングを使用して、大規模なデータセットでトレーニングされます。リバーブは音声の品質を低下させて理解しにくくするだけでなく、自動音声認識の精度も向上させます。

Xiaozhaはたくさんのお金を使いました! Meta はメタバース専用の AI モデルを開発しました

VIDA は、視覚的な手がかりだけでなく、観察に音声も使用するという点でユニークです。 VIDA は、一般的な音声のみのアプローチを改良し、音声を強化し、声と話者を識別できます。

Visual Voice (VisualVoice)

Meta AI によってリリースされた 3 番目の音響モデルである VisualVoice は、ビデオから音声を抽出できます。 VIDA と同様に、VisualVoice は、ラベルのないビデオからのオーディオビジュアルキューに基づいてトレーニングされます。音声を自動的に分離したモデルです。

このモデルには、聴覚障害者向けのテクノロジーの開発、ウェアラブル AR デバイスのサウンド強化、騒がしい環境でのオンライン ビデオからの音声の文字起こしなど、重要なアプリケーション シナリオがあります。

Audio2Face

昨年、Nvidia は、あらゆるナレーションにマッチする AI 駆動のフェイシャル アニメーションを生成する Omniverse Audio2Face のオープン ベータ版をリリースしました。このツールは、ゲームや視覚効果をアニメーション化する長くて退屈なプロセスを簡素化します。このアプリでは、ユーザーが複数の言語でコマンドを発行することもできます。

Xiaozhaはたくさんのお金を使いました! Meta はメタバース専用の AI モデルを開発しました

今年の初めに、Nvidia はツールのアップデートをリリースし、ユーザーがニュートラル アバターから一連のブレンドシェイプを作成できるようにするブレンドシェイプ生成などの機能を追加しました。さらに、ストリーミング オーディオ プレーヤーの機能が追加され、テキスト読み上げアプリケーションを使用してオーディオ データをストリーミングできるようになりました。 Audio2Face は、オーディオ トラックでアニメーション化できる 3D キャラクター モデルをセットアップします。次に、音声はディープ ニューラル ネットワークに供給されます。ユーザーは後処理でキャラクターを編集してパフォーマンスを変更することもできます。

以上がXiaozhaはたくさんのお金を使いました! Meta はメタバース専用の AI モデルを開発しましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
1つのプロンプトは、すべての主要なLLMのセーフガードをバイパスできます1つのプロンプトは、すべての主要なLLMのセーフガードをバイパスできますApr 25, 2025 am 11:16 AM

HiddenLayerの画期的な研究は、主要な大規模な言語モデル(LLMS)における重大な脆弱性を明らかにしています。 彼らの発見は、ほぼすべての主要なLLMSを回避できる「政策の人形劇」と呼ばれる普遍的なバイパス技術を明らかにしています

5つの間違いほとんどの企業が今年持続可能性を備えています5つの間違いほとんどの企業が今年持続可能性を備えていますApr 25, 2025 am 11:15 AM

環境責任と廃棄物の削減の推進は、企業の運営方法を根本的に変えています。 この変革は、製品開発、製造プロセス、顧客関係、パートナーの選択、および新しいものの採用に影響します

H20チップバンジョルツチャイナ企業ですが、彼らはインパクトのために長い間支えられてきましたH20チップバンジョルツチャイナ企業ですが、彼らはインパクトのために長い間支えられてきましたApr 25, 2025 am 11:12 AM

高度なAIハードウェアに関する最近の制限は、AI優位のためのエスカレートする地政学的競争を強調し、中国の外国半導体技術への依存を明らかにしています。 2024年、中国は3,850億ドル相当の半導体を大量に輸入しました

OpenaiがChromeを購入すると、AIはブラウザ戦争を支配する場合がありますOpenaiがChromeを購入すると、AIはブラウザ戦争を支配する場合がありますApr 25, 2025 am 11:11 AM

GoogleからのChromeの強制的な売却の可能性は、ハイテク業界での激しい議論に火をつけました。 Openaiが65%の世界市場シェアを誇る大手ブラウザを取得する見込みは、THの将来について重要な疑問を提起します

AIが小売メディアの成長する痛みをどのように解決できるかAIが小売メディアの成長する痛みをどのように解決できるかApr 25, 2025 am 11:10 AM

全体的な広告の成長を上回っているにもかかわらず、小売メディアの成長は減速しています。 この成熟段階は、生態系の断片化、コストの上昇、測定の問題、統合の複雑さなど、課題を提示します。 ただし、人工知能

「aiは私たちであり、それは私たち以上のものです」「aiは私たちであり、それは私たち以上のものです」Apr 25, 2025 am 11:09 AM

古いラジオは、ちらつきと不活性なスクリーンのコレクションの中で静的なパチパチと鳴ります。簡単に不安定になっているこの不安定な電子機器の山は、没入型展示会の6つのインスタレーションの1つである「e-waste land」の核心を形成しています。

Google Cloudは、次の2025年にインフラストラクチャについてより深刻になりますGoogle Cloudは、次の2025年にインフラストラクチャについてより深刻になりますApr 25, 2025 am 11:08 AM

Google Cloudの次の2025年:インフラストラクチャ、接続性、およびAIに焦点を当てています Google Cloudの次の2025年の会議では、多くの進歩を紹介しました。 特定の発表の詳細な分析については、私の記事を参照してください

Baby Ai Meme、Arcanaの550万ドルのAI映画パイプライン、IRの秘密の支援者が明らかにした話Baby Ai Meme、Arcanaの550万ドルのAI映画パイプライン、IRの秘密の支援者が明らかにした話Apr 25, 2025 am 11:07 AM

今週はAIとXR:AIを搭載した創造性の波が、音楽の世代から映画制作まで、メディアとエンターテイメントを席巻しています。 見出しに飛び込みましょう。 AIに生成されたコンテンツの影響力の高まり:テクノロジーコンサルタントのShelly Palme

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

EditPlus 中国語クラック版

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

Dreamweaver Mac版

Dreamweaver Mac版

ビジュアル Web 開発ツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

MantisBT

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール