Meta Platforms 社の人工知能部門は最近、少量のトレーニング データのサポートを利用して AI モデルに物理世界の歩き方を学習させ、急速な進歩を遂げたと発表しました。
この研究により、AI モデルが視覚的なナビゲーション機能を獲得するまでの時間を大幅に短縮できます。以前は、このような目標を達成するには、大規模なデータセットを使用した「強化学習」を繰り返す必要がありました。
メタ AI 研究者らは、この AI ビジュアル ナビゲーションの探求は仮想世界に大きな影響を与えるだろうと述べています。このプロジェクトの基本的なアイデアは複雑ではありません。単純に観察と探索を通じて、AI が人間と同じように物理空間を移動できるようにするというものです。
メタ AI 部門は次のように説明しました。「たとえば、AR メガネに鍵を見つけるようガイドしてもらいたい場合、AI が不慣れで変化する環境のレイアウトを理解できるようにする方法を見つけなければなりません。結局のところ、これは非常に詳細で小規模な要件であるため、大量の計算能力を消費する高精度のプリセット マップに永久に依存することは不可能です。人間はコーヒー テーブルの正確な位置や長さを知る必要がなく、コーヒー テーブルの隅を簡単に移動できます。
この目的を達成するために、Meta は「身体化 AI」、つまり 3D シミュレーションのインタラクティブなメカニズムを通じて AI システムをトレーニングすることに注力することにしました。この分野でメタ社は、地図やGPSセンサーなしで新しい環境をナビゲートできる有望な「ポイントターゲットナビゲーションモデル」を確立したと述べた。
このモデルは視覚計測と呼ばれる技術を使用しており、AI が視覚入力に基づいて現在位置を追跡することができます。メタ氏は、このデータ拡張技術により、手動でデータに注釈を付ける必要がなく、効果的なニューラル モデルを迅速にトレーニングできると述べました。 Meta 氏はまた、自社の Habitat 2.0 を組み込んだ AI トレーニング プラットフォーム (Realistic PointNav ベンチマーク タスクを使用して仮想空間シミュレーションを実行する) でのテストを完了し、成功率は 94% であると述べました。
Meta 氏は次のように説明しました。「私たちの手法はデータセット内のすべてのシナリオを完全に解決したわけではありませんが、この研究は、現実世界の環境でナビゲートする能力が十分ではないことを最初に証明しました。必ず明示的なマッピングを実装する必要があります。」
マップに依存せずに AI ナビゲーション トレーニングをさらに改善するために、Meta は Habitat-Web と呼ばれるトレーニング データ セットを確立しました。これには、100,000 を超える異なるオブジェクトとゴールのナビゲーションが含まれています。人間が実証した手法。 Webブラウザ上で動作するHabitatシミュレーターはAmazon.comのMechanical Turkサービスにスムーズに接続でき、ユーザーは仮想ロボットを遠隔地から安全に操作できる。メタ氏は、得られたデータはAIエージェントが「最先端の結果」を達成するためのトレーニング資料として使用されると述べた。全体的な空間特性を理解するために部屋をスキャンしたり、隅に障害物があるかどうかを確認したりすることは、すべて AI が人間から学習できる効率的なオブジェクト検索動作です。
さらに、メタ AI チームは、ロボットが独自の「ゼロサンプル セット」を通じてさまざまなセマンティック ナビゲーション タスクや目標モードをナビゲートできるようにする、いわゆる「プラグ アンド プレイ」モジュール式アプローチも開発しました。体験学習フレームワーク」の一般化を実現。このようにして、AI エージェントはリソースを大量に消費するマップやトレーニングを必要とせずに基本的なナビゲーション スキルを習得でき、追加の調整を行わずに 3D 環境でさまざまなタスクを実行できます。
#メタは、これらのエージェントは画像ターゲットを継続的に検索するように訓練されていると説明しています。彼らは環境内のランダムな場所で撮影された写真を受け取り、自律ナビゲーションを使用してその場所を見つけようとします。メタ研究者らは、「我々の手法はトレーニングデータを1/12.5に削減し、最新の転移学習技術よりも成功率が14%高い」と述べた
Constellation Researchのアナリスト、ホルガー・ミュラー氏はインタビューでZhong氏は次のように述べた。メタのこの最新の開発は、メタバース開発計画において重要な役割を果たすことが期待されています。彼は、将来的に仮想世界が標準になるのであれば、AI はこの新しい空間を理解できる必要があり、理解するためのコストはそれほど高くないと考えています。
Mueller 氏はさらに、「AI の物理世界を理解する能力は、ソフトウェアベースの方法によって拡張する必要があります。Meta は現在この道を進んでおり、トレーニングを必要としない AI を開発するなど、身体化された AI において進歩を遂げています。」と付け加えました。 「周囲の環境を自律的に理解できるソフトウェア。これが早期に実用化されるのを楽しみにしています。」
これらの実際の使用例は、私たちからそう遠くないかもしれません。メタ氏は、次のステップは、これらの結果をナビゲーションからモバイル操作に発展させ、特定のタスク(ウォレットを識別して所有者に返すなど)を実行できるAIエージェントを開発することだと述べた。
以上がメタ研究者が AI の新たな試みを行う:地図やトレーニングなしで物理的に移動するようにロボットに教えるの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

私のコラムに新しいかもしれない人のために、具体化されたAI、AI推論、AIのハイテクブレークスルー、AIの迅速なエンジニアリング、AIのトレーニング、AIのフィールディングなどのトピックなど、全面的なAIの最新の進歩を広く探求します。

ヨーロッパの野心的なAI大陸行動計画は、人工知能のグローバルリーダーとしてEUを確立することを目指しています。 重要な要素は、AI GigaFactoriesのネットワークの作成であり、それぞれが約100,000の高度なAIチップを収容しています。

AIエージェントアプリケーションに対するMicrosoftの統一アプローチ:企業の明確な勝利 新しいAIエージェント機能に関するマイクロソフトの最近の発表は、その明確で統一されたプレゼンテーションに感銘を受けました。 TEで行き詰まった多くのハイテクアナウンスとは異なり

Shopify CEOのTobiLütkeの最近のメモは、AIの能力がすべての従業員にとって基本的な期待であると大胆に宣言し、会社内の重大な文化的変化を示しています。 これはつかの間の傾向ではありません。これは、pに統合された新しい運用パラダイムです

IBMのZ17メインフレーム:AIを強化した事業運営の統合 先月、IBMのニューヨーク本社で、Z17の機能のプレビューを受け取りました。 Z16の成功に基づいて構築(2022年に開始され、持続的な収益の成長の実証

揺るぎない自信のロックを解除し、外部検証の必要性を排除します! これらの5つのCHATGPTプロンプトは、完全な自立と自己認識の変革的な変化に向けて導きます。 ブラケットをコピー、貼り付け、カスタマイズするだけです

人工知能のセキュリティおよび研究会社であるAnthropicによる最近の[研究]は、これらの複雑なプロセスについての真実を明らかにし始め、私たち自身の認知領域に不穏に似た複雑さを示しています。自然知能と人工知能は、私たちが思っているよりも似ているかもしれません。 内部スヌーピング:人類の解釈可能性研究 人類によって行われた研究からの新しい発見は、AIの内部コンピューティングをリバースエンジニアリングすることを目的とする機械的解釈可能性の分野の大きな進歩を表しています。AIが何をするかを観察するだけでなく、人工ニューロンレベルでそれがどのように行うかを理解します。 誰かが特定のオブジェクトを見たり、特定のアイデアについて考えたりしたときに、どのニューロンが発射するかを描くことによって脳を理解しようとすることを想像してください。 a

Qualcomm's DragonWing:企業とインフラストラクチャへの戦略的な飛躍 Qualcommは、新しいDragonwingブランドで世界的に企業やインフラ市場をターゲットにして、モバイルを超えてリーチを積極的に拡大しています。 これは単なるレブランではありません


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

SecLists
SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

メモ帳++7.3.1
使いやすく無料のコードエディター

ドリームウィーバー CS6
ビジュアル Web 開発ツール

AtomエディタMac版ダウンロード
最も人気のあるオープンソースエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ホットトピック



