パラメータ数は5,620億！ Google、ロボットが自律的にさまざまなタスクを実行できるようにする史上最大の「ジェネラリスト」AI モデル PaLM-E をリリース

パラメータ数は5,620億！ Google、ロボットが自律的にさまざまなタスクを実行できるようにする史上最大の「ジェネラリスト」AI モデル PaLM-E をリリース

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 11, 2023 pm 12:58 PM

AI視覚言語モデル

3 月 8 日の月曜日のニュース、Google とベルリン工科大学の人工知能研究者のグループは、最大 5,620 億のパラメーター量 (パラメーターGPT-3 の量は 1,750 億です)。

PaLM-E は既知の最大の VLM (ビジュアル言語モデル）。マルチモーダルに組み込まれた VLM として、画像を理解するだけでなく、言語を理解し、生成し、再トレーニングすることなくさまざまな複雑なロボット命令を実行することもできます。また、強力な創発能力 (予測不可能な動作をするモデル) も示します。

Google によると、「引き出しの中の米フレークを持ってきて」などの高度なコマンドが与えられると、PaLM-E はアームを備えた移動ロボットプラットフォーム (Google Robotics が開発) を生成できます。行動計画を立て、その行動を自分で実行する。

#PaLM-E は、シーンを前処理せずにロボットのカメラからのデータを分析することでこれを実現します。これにより、人間がデータを前処理したり注釈を付けたりする必要がなくなり、ロボット制御がより自律的になります。

PaLM-E は柔軟性もあり、環境に反応することができます。たとえば、PaLM-E モデルは、キッチンからポテトチップスの袋を取り出すようにロボットを誘導できますが、PaLM-E は制御ループに統合されているため、作業中に発生する可能性のある中断に耐性があります。あるビデオの例では、研究者がロボットの手からポテトチップスを掴んで動かしましたが、ロボットはポテトチップスを見つけて再び掴みました。

さらに、PaLM-E モデルは、本来は人間の指導が必要な複雑なタスクを自律的に完了するようにロボットを制御することもできます。ロボット工学に加えて、Google 研究者らは、PaLM-E の中核として大規模な言語モデルを使用することによるいくつかの興味深い効果も観察しました。その 1 つは、PaLM-E が「順方向転送」を示すことができることです。これは、PaLM-E がタスクから学習できることを意味します。獲得した知識とスキルは別のタスクに移すことができ、単一タスクのロボットモデルよりも優れたパフォーマンスを発揮できます。

Google の研究者らは、将来、ホームオートメーションや産業用ロボットなど、PaLM-E のより多くの実世界への応用を検討する予定であり、PaLM-E がマルチモーダル AI のより多くの応用を刺激できることを期待しています。

IT Houseは、Google AIの強力なライバルであるMicrosoftも、同様の方法でビジュアルデータと大規模データを組み合わせた「ChatGPT for Robotics」に関する論文を最近発表したと報じた。ロボット。

以上がパラメータ数は5,620億！ Google、ロボットが自律的にさまざまなタスクを実行できるようにする史上最大の「ジェネラリスト」AI モデル PaLM-E をリリースの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

迅速なエンジニアリングにおける思考のグラフは何ですかApr 13, 2025 am 11:53 AM

導入迅速なエンジニアリングでは、「思考のグラフ」とは、グラフ理論を使用してAIの推論プロセスを構造化および導く新しいアプローチを指します。しばしば線形sを含む従来の方法とは異なります

Genaiエージェントとの電子メールマーケティングを組織に最適化しますApr 13, 2025 am 11:44 AM

導入おめでとう！あなたは成功したビジネスを運営しています。ウェブページ、ソーシャルメディアキャンペーン、ウェビナー、会議、無料リソース、その他のソースを通じて、毎日5000の電子メールIDを収集します。次の明白なステップはです

Apache Pinotによるリアルタイムアプリのパフォーマンス監視Apr 13, 2025 am 11:40 AM

導入今日のペースの速いソフトウェア開発環境では、最適なアプリケーションパフォーマンスが重要です。応答時間、エラーレート、リソース利用などのリアルタイムメトリックを監視することで、メインに役立ちます

ChatGptは10億人のユーザーにヒットしますか？「わずか数週間で2倍になりました」とOpenai CEOは言いますApr 13, 2025 am 11:23 AM

「ユーザーは何人いますか？」彼は突き出した。「私たちが最後に言ったのは毎週5億人のアクティブであり、非常に急速に成長していると思います」とアルトマンは答えました。「わずか数週間で2倍になったと言った」とアンダーソンは続けた。「私はそのprivと言いました

PIXTRAL -12B：Mistral AI＆＃039;の最初のマルチモーダルモデル-Analytics VidhyaApr 13, 2025 am 11:20 AM

導入 Mistralは、最初のマルチモーダルモデル、つまりPixtral-12B-2409をリリースしました。このモデルは、Mistralの120億個のパラメーターであるNemo 12bに基づいて構築されています。このモデルを際立たせるものは何ですか？これで、画像とTexの両方を採用できます

生成AIアプリケーションのエージェントフレームワーク - 分析VidhyaApr 13, 2025 am 11:13 AM

クエリに応答するだけでなく、情報を自律的に収集し、タスクを実行し、テキスト、画像、コードなどの複数のタイプのデータを処理するAIを搭載したアシスタントがいることを想像してください。未来的に聞こえますか？これでa

金融セクターにおける生成AIの応用Apr 13, 2025 am 11:12 AM

導入金融業界は、効率的な取引と信用の可用性を促進することにより経済成長を促進するため、あらゆる国の発展の基礎となっています。取引の容易さとクレジット

オンライン学習とパッシブアグレッシブアルゴリズムのガイドApr 13, 2025 am 11:09 AM

導入データは、ソーシャルメディア、金融取引、eコマースプラットフォームなどのソースから前例のないレートで生成されています。この連続的な情報ストリームを処理することは課題ですが、

See all articles

ホットAIツール

ホットツール

SAP NetWeaver Server Adapter for Eclipse

ホットトピック

Gmailメールのログイン入り口はどこですか？

7489

CakePHP チュートリアル

1377

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

パラメータ数は5,620億！ Google、ロボットが自律的にさまざまなタスクを実行できるようにする史上最大の「ジェネラリスト」AI モデル PaLM-E をリリース

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

SAP NetWeaver Server Adapter for Eclipse

AtomエディタMac版ダウンロード

ZendStudio 13.5.1 Mac

VSCode Windows 64 ビットのダウンロード

ゼンドスタジオ 13.0.1

ホットトピック