ホームページ >テクノロジー周辺機器 >AI >2 人の巨人は同時に楽観的です!人工知能という新しい用語が追加されましたが、これは AI の次の波でしょうか?

2 人の巨人は同時に楽観的です!人工知能という新しい用語が追加されましたが、これは AI の次の波でしょうか?

王林
王林転載
2023-05-27 09:52:411429ブラウズ

5 月 18 日、ロボット コンセプト株が指値上昇傾向を開始しました。記事の時点で、Fengli Intelligent と Youde Precision は 1 日あたりの指値 20cm に達していました。Robot、Haozhi Electromechanical、Jiangsu Leili、Green Harmonic は上昇しました。 10%以上上昇。南方精工と元達は10%以上上昇。インテリジェンス、華公科技などが1日の上限に達した

2 人の巨人は同時に楽観的です!人工知能という新しい用語が追加されましたが、これは AI の次の波でしょうか?

ニュース、ITF World 2023 Semiconductor Conference で、Huang Renxun 氏は、人工知能の次の波は身体化知能 (embedded AI)、つまり物理世界を理解し、推論し、対話できるインテリジェント システムになるだろうと述べました。

さらに、5月16日のテスラ株主総会でマスク氏は、人型ロボットが将来テスラの主な長期価値の源泉になると述べた。同氏はロボットの説明に多くの紙面を費やし、人型ロボット「オプティマス」の需要は自動車の需要をはるかに上回る100億台に達し、その額は数百億ドルに達する可能性があると推測した。

テスラと NVIDIA という 2 つの巨人から同時に支持されているため、人型ロボット分野は確かに高い注目に値します。

さらに、北京は汎用人工知能の開発を促進するためのいくつかの措置を発表しました。また、身体化された知能の表現もあります。身体化された知能システムの研究と応用を促進し、オープンな環境、一般化されたシナリオ、継続的なタスクなどの複雑な条件下でのロボットの知覚、認知、意思決定技術を突破することです。

2 人の巨人は同時に楽観的です!人工知能という新しい用語が追加されましたが、これは AI の次の波でしょうか?

人工知能という新しい用語が追加されました

「身体化されたインテリジェンス」の起源は、チューリングが論文「コンピューティング機械とインテリジェンス」で初めてこの概念を提案した 1950 年に遡ります。自律的な意思決定と行動能力を備えた一種の機械知能を指し、人間と同じように環境を認識して理解し、自律的な学習と適応的な行動を通じてタスクを完了できます。

より具体的には、人間と同じように環境と対話し環境を認識し、自律的な計画・意思決定・行動・実行能力を有するロボット/シミュレーター(仮想環境を指す) AI の究極の形であり、私たちはそれを仮に身体化知能「ロボット」と呼んでいます。その実装には、コンピューター ビジョン、自然言語処理、ロボット工学など、さまざまな人工知能テクノロジーが含まれます。

スタンフォード大学のコンピューターサイエンス教授であるリー・フェイフェイ氏は、「身体化の意味は身体そのものではなく、環境と相互作用し、環境の中で物事を行う際の全体的なニーズと機能です。」

2 人の巨人は同時に楽観的です!人工知能という新しい用語が追加されましたが、これは AI の次の波でしょうか?

簡単に言えば、身体化されたインテリジェントロボットは人間の言語を理解し、対応するタスクを完了することができます。理想は壮大ですが、現実には「人間の言語を理解する」ことしかできず、ロボットを制御するには依然として手書きのコードに大きく依存する必要があります。

NVIDIA のロボット研究シニア ディレクターでワシントン大学教授のディーター フォックス氏は、ロボット研究の重要な目標は、現実世界で人間に役立つロボットを構築することであると指摘しました。しかし、これを行うには、まず人間に触れ、人間との関わり方を学ばなければなりません。

AI の次の波

巨人は人型ロボットトラックに投資しています。テスラが昨年オプティマスのプロトタイプを発売した後、最近ではノルウェーのロボットメーカー 1X Technologies の A2 ラウンドの資金調達を主導した OpenAI Venture Fund も参加していますが、chatGPT は知覚能力の向上にも役立ちます人型ロボットの開発と産業の変化を加速します。

GPT のような大規模モデルの出現は、新しいアイデアをもたらしました - 多くの研究者は、画像、テキスト、および具体化されたデータの共同トレーニングを通じて、マルチモーダル大規模言語モデルとロボットを組み合わせることを試み、マルチモーダル入力強化機能を導入しました。モデルが現実の物体を理解し、ロボットが具体化された推論タスクを処理するのに役立ちます。

Google と Microsoft の AI チームは最前線で、大型モデルを備えたロボットに魂を注入しようとしています。

3 月 8 日、Google とベルリン工科大学のチームは、最大 5,620 億のパラメーター量を持つ史上最大のビジュアル言語モデル PaLM-E を発表しました (GPT-3 のパラメーター量は 1,750 億) )。マルチモーダルな身体化視覚言語モデル (VLM) として、PaLM-E は画像を理解するだけでなく、言語を理解して生成することもでき、さまざまな複雑なロボット命令を再トレーニングすることなく実行できます。 Googleの研究者らは、ホームオートメーションや産業用ロボットなど、PaLM-Eのより現実世界の応用を研究する予定だ。彼らは、PaLM-E がマルチモーダル推論と身体化 AI に関する研究をさらに推進できることを期待しています。

最近の研究では、Microsoft チームは、OpenA が開発した ChatGPT をロボット工学の分野に拡張し、言語を使用してロボット アーム、ドローン、ホーム アシスタント ロボットなどの複数のプラットフォームを直感的に制御できるようにする方法を模索しています。研究者らは、ロボットの問題を解決する ChatGPT の複数の例を挙げ、また、運用、航空、ナビゲーションなどの分野での複雑なロボットの展開を解決するための ChatGPT の使用についても紹介しました。

2 人の巨人は同時に楽観的です!人工知能という新しい用語が追加されましたが、これは AI の次の波でしょうか?

Google と Microsoft が身体化 AI に対して非常に似た期待を抱いていることは明らかです: 人間がロボットを操作し、複雑なプログラミング言語やロボット システムの詳細を学ぶ必要はありません。 robot) は「「The robot completes the task」(ロボットがタスクを完了する)で、「指を使う腕のように便利」な状態に達します。

したがって、ChatGPT のような大規模な言語モデルは、身体化された知能における人間とコンピューターの便利な対話を実現する上で重要な役割を果たします。

chatGPT に代表される大規模なモデルが汎用 AI の新時代を切り開いたとしたら、マルチモーダル、身体化された、アクティブでインタラクティブな人工知能がこの時代を前進させる唯一の道となるはずです。

以上が2 人の巨人は同時に楽観的です!人工知能という新しい用語が追加されましたが、これは AI の次の波でしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はsohu.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。