深層学習の巨人 DeepMind は ImageNet データセットで画期的な進歩を遂げ、ロボット研究に新たなマイルストーンをもたらしました
なぜロボット工学は、自然言語処理 (NLP)、視覚、その他の人工知能分野に大きく遅れをとっているのでしょうか?さまざまな問題の中でも特に、データ不足が主な理由です。この問題を解決するために、Google DeepMind とその他の機関はオープン X-Embodiment データセットを立ち上げ、より強力な RT-X モデルのトレーニングに成功しました

#これはどのようにして達成されるのでしょうか?
ロボットは通常、特定のことを行うことに非常に特化していますが、一般的な能力は貧弱であることがわかっています。通常、タスク、ロボット、環境ごとにモデルをトレーニングする必要があります。変数を変更するには、多くの場合、最初からやり直す必要があります。しかし、さまざまなロボット工学分野の知識を組み合わせて、万能ロボットを訓練する方法を作成できたらどうなるでしょうか?
これは、DeepMind がしばらくの間取り組んできたことです。彼らは、22 種類の異なるロボットからのデータをプールして Open X-Embodiment データセットを作成し、より高性能な RT-X (それぞれ RT-1-X と RT-2-X) をトレーニングしました。
彼らは 5 つの異なる研究機関で RT-1-X モデルをテストし、その結果、新しい方法がロボットごとに個別に開発された方法よりも優れたパフォーマンスを示したことがわかりました。一般的に使用される 5 種類のロボット間で成功率が 50% 増加しました。また、上記のデータセットでトレーニングされた RT-2-X が現実世界のロボット スキルのパフォーマンスを 2 倍向上させ、新しいデータを学習することで RT-2-X が多くの新しいスキルを習得することも示しています。この研究は、複数のロボット タイプのデータでトレーニングされた単一のモデルが、単一のロボット タイプのデータでトレーニングされたモデルよりも複数のロボット上で大幅に優れたパフォーマンスを発揮することを示しています。


具体的には、RT-1 を使用して RT-1-X をトレーニングしました。RT-1 は、Transformer アーキテクチャ上に構築された 35M パラメータ ネットワークであり、ロボット制御用に設計されています。設計を図 3 に示します。
RT-1-X の平均成功率は、元の方法より 50% 高くなります。

順番にRT-X の知識伝達機能を研究するために、DeepMind は他の実験を実施しました。これらの実験には、RT-2 データセットには存在しないが、別のロボットのデータセットには存在していたオブジェクトとスキルが含まれていました。その結果、RT-2-X は、以前の最高のモデルである RT-2 に比べて、新しいスキルの習得に 3 倍成功していることがわかりました。これは、他のプラットフォームからのデータを使用した共同トレーニングにより、元のデータセットには存在しない追加のスキルを RT-2-X に与え、新しいタスクを実行できることも示しています。

RT-2-X は、他のロボットからのデータを RT-2-X トレーニングに組み込むことでロボットのタスクのパフォーマンス範囲を向上できることを示していますが、これは十分に高いデータを使用した場合に限られます。容量アーキテクチャ。
##ロボット研究は、刺激的な初期段階にあります。 DeepMind によるこの新しい研究は、より多様なデータとより優れたモデルを使用して学習を拡張することで、より有用な支援ロボットを開発できる可能性があることを示しています。オープンかつ責任ある方法でロボット研究を進めるには、世界中の研究室と協力してリソースを共有することが重要です。 DeepMind は、データ ソースをオープンし、安全だが限定的なモデルを提供することで障壁を減らし、研究を加速したいと考えています。ロボット工学の未来は、ロボットが相互に学習すること、そして最も重要なこととして、研究者が相互に学習できるかどうかにかかっています。
論文リンク: https://robotics-transformer-x.github.io/paper.pdf

参考リンク: https://www.deepmind.com/blog/scaling -さまざまな種類のロボットを対象とした学習 #
以上が深層学習の巨人 DeepMind は ImageNet データセットで画期的な進歩を遂げ、ロボット研究に新たなマイルストーンをもたらしましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ドキュメントの取り扱いは、AIプロジェクトでファイルを開くだけでなく、カオスを明確に変えることです。 PDF、PowerPoint、Wordなどのドキュメントは、あらゆる形状とサイズでワークフローをフラッシュします。構造化された取得

Googleのエージェント開発キット(ADK)のパワーを活用して、実際の機能を備えたインテリジェントエージェントを作成します。このチュートリアルは、ADKを使用して会話エージェントを構築し、GeminiやGPTなどのさまざまな言語モデルをサポートすることをガイドします。 w

まとめ: Small Language Model(SLM)は、効率のために設計されています。それらは、リソース不足、リアルタイム、プライバシーに敏感な環境の大手言語モデル(LLM)よりも優れています。 特にドメインの特異性、制御可能性、解釈可能性が一般的な知識や創造性よりも重要である場合、フォーカスベースのタスクに最適です。 SLMはLLMSの代替品ではありませんが、精度、速度、費用対効果が重要な場合に理想的です。 テクノロジーは、より少ないリソースでより多くを達成するのに役立ちます。それは常にドライバーではなく、プロモーターでした。蒸気エンジンの時代からインターネットバブル時代まで、テクノロジーの力は、問題の解決に役立つ範囲にあります。人工知能(AI)および最近では生成AIも例外ではありません

コンピュータービジョンのためのGoogleGeminiの力を活用:包括的なガイド 大手AIチャットボットであるGoogle Geminiは、その機能を会話を超えて拡張して、強力なコンピュータービジョン機能を網羅しています。 このガイドの利用方法については、

2025年のAIランドスケープは、GoogleのGemini 2.0 FlashとOpenaiのO4-Miniの到着とともに感動的です。 数週間離れたこれらの最先端のモデルは、同等の高度な機能と印象的なベンチマークスコアを誇っています。この詳細な比較

Openaiの最新のマルチモーダルモデルであるGPT-Image-1は、ChatGPT内およびAPIを介して画像生成に革命をもたらします。 この記事では、その機能、使用法、アプリケーションについて説明します。 目次 GPT-Image-1の理解 GPT-Image-1の重要な機能

データの前処理は、機械学習を成功させるために最も重要ですが、実際のデータセットにはエラーが含まれることがよくあります。 CleanLabは、Pythonパッケージを使用して自信のある学習アルゴリズムを実装する効率的なソリューションを提供します。 検出を自動化します

「AI-Ready労働力」という用語は頻繁に使用されますが、サプライチェーン業界ではどういう意味ですか? サプライチェーン管理協会(ASCM)のCEOであるAbe Eshkenaziによると、批評家ができる専門家を意味します


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

MantisBT
Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

DVWA
Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、

mPDF
mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

ZendStudio 13.5.1 Mac
強力な PHP 統合開発環境

ホットトピック









