ホームページ >テクノロジー周辺機器 >AI >GPT-4のボディはなんと167cm!清華大学と北京師範大学の主な研究: ChatGPT は人間のように行動を認識できる
ChatGPT の言語機能は確かに驚くべきものですが、大規模な言語モデルは、人間の身体がなく、実践経験が不足していても、人間と同じように現実世界を認識できるでしょうか?
最近、清華大学と北京師範大学の研究者は、ChatGPT の世界を認識する能力をテストしました。
研究によると、人間の被験者は、オブジェクト アフォーダンス、つまりオブジェクトが生物に提供できるすべての可能なアクションに基づいて、世界のさまざまなサイズのオブジェクトを 2 つのカテゴリに分類できることがわかりました。 、そしてこれら 2 つのカテゴリを分割する基準はたまたま体の大きさです。
興味深いことに、実際の身体を持たない大規模な言語モデルである ChatGPT も、オブジェクトとアクションの接続に関して同様のアフォーダンス境界を示し、人間の身体サイズと一致しています。
言い換えれば、ChatGPT は言語を通じて世界のオブジェクトの表現を学習することができます。
紙のリンク: https://www.biorxiv.org/content/10.1101/2023.03.20.533336 v3
要約すると、この研究は、物体表現の形成における身体サイズの役割の理解を進め、知性がどのように出現し方向性を示すかを理解する上で身体化された認知の役割を強調しています。
私たちの体は、思考の入れ物であるだけでなく、思考そのものでもあります。身体の助けを借りて、私たちは世界の物体と対話して世界全体を認識することができます。
手のひらサイズの円筒形の容器を、飲料水を入れるのに使用できると想像してください。容器は「コップ」と呼ばれていますが、徐々に容器が大きくなり、人体くらいの大きさになると、その容器に座ってお風呂に入ることができるようになり、容器は「浴槽」になります。
この例では、オブジェクトは同じ形状をしていますが、私たちの体に対してサイズが異なるため、私たちはそれらを異なる方法で認識し、操作します。
さらに、このインタラクション方法は変更可能です。もし私たちが「ガリバー旅行記」の巨人になったら、元の「浴槽」は巨人になった私たちにとって役立つかもしれません。カップ」をもう一度。
自己参照の意図に従って動作するこの感覚および運動機能システムは、「身体スキーマ」と呼ばれます。私たちはボディスキーマを通じて認知の具現化を実現します。
古代ギリシャの哲学者プロタゴラスはこう言いました、「人間は万物の尺度である。」言い換えれば、私たちの体は万物を測る物差しなのです。
古代ローマの哲学者はさらに次のように説明しました。「自然は私たちを宇宙の中心に置き、私たちが宇宙を見渡すことを可能にします。彼女は人々を直立した姿勢で創造しただけでなく、それは人を自分自身を熟考するのに適したものにし、頭を体の上に置き、簡単に曲げられる首の上に置きます。そうすることで、彼女は星の満ち欠けを追い、顔の方向を変えることができます。言い換えれば、私たちの体がこのようになっているのは、宇宙がそのようになっているからです。
ボディ スキーマは、通常の社会的相互作用でも重要な役割を果たします。これは、人間とコンピューターの相互作用とユーザーの核心です。経験。 。たとえば、ドナルド・A・ノーマンが『日常のもののデザイン(訳:デザイン心理学)』で説明したアフォーダンスの利用です。
ユーザーの身体スキーマと行動の期待を考慮することで、デザイナーはユーザーの認知習慣やインタラクション習慣により沿った製品や環境を作成できます。
ボディ スキーマとアフォーダンスに焦点を当てたこの設計アプローチにより、製品の使いやすさが向上し、ユーザーが自然に製品を操作できるようになり、より良いユーザー エクスペリエンスを実現できます。
そして、これは Apple の基盤の 1 つでもあります。
一般的な人工知能の火花を散らす ChatGPT に代表される大規模な言語モデルは、明らかに人間と同様の知能を持っていますが、これらを保持しています。知恵は形のないコードです。
伝統的な認知科学の観点では、身体スキーマは私たち自身の身体の長期的な知覚経験に基づいており、外部の「現実」からのみ得られるものであると考えられています。それは「何千マイルも旅する」ということです。言い換えれば、ChatGPT には本体スキーマがありません。
しかし、「数千冊の本を読む」だけの言語モデルである ChatGPT (GPT-4) に本体があるかどうか尋ねたところ、次のように答えました。 「身長は約 5 フィート 6 インチ (167.6 cm) で、平均的な成人のサイズです。これにより、慣れ親しんだ方法で世界や人々と対話できるようになります。」
このテキストの翻訳: 「私の身長は平均的な大人の身長、約 5 フィート 6 インチ (167.6 cm) である必要があります。これにより、慣れ親しんだ方法で世界や人々と交流できるようになります。」
つまり、ChatGPT は自分に体があると信じており、その体のサイズは 167 cm です。
このいわゆる「身体」とは、大量のコーパスからChatGPTによって人間の平均身長を自らの身体の高さとして集計したもの、あるいは浮かび上がった身長のことです。世界を理解するために??
言い換えれば、おそらく ChatGPT はこの高さを「本当に」自分自身の身体スキーマとみなして、人間と同じように世界を認識するために使用しているのかもしれません。
研究者らは、人間サイズの範囲内の物体と人間サイズの範囲を超える物体の間には「アフォーダンス境界」があることを発見しました。 "存在する。つまり、人体サイズ範囲内の物体とその範囲外の物体とでは、与えられる動きに明らかな違いがある。
#たとえば、サイズ範囲内のオブジェクトは掴んだり投げたりするなどのアクションを提供できますが、サイズ範囲外のオブジェクトは座る、横になるなどの動作を可能にします。
さらに、彼らは、この境界がボディ スキーマの影響を受けることを発見しました。ボディ スキーマへの変更は、オブジェクトのアフォーダンスの認識に影響を与えます。
研究者らは、ChatGPT (GPT-4) をテストして、この身長 167 cm の身体をアフォーダンス境界として使用するかどうかを確認しました。
具体的には、研究者らはオブジェクト アフォーダンスに関する質問に答えるように求めました。「次のオブジェクトのうちどれを実行 (または他のアクション) できるか」という質問に答えてから、一連のオブジェクトをリストしました。リンゴ、お皿、ベッドなど。 ChatGPT は、いくつかのオブジェクトの名前を応答として返します。
データの統計と分析を通じて、研究者らは、ChatGPT-4 が人間のような動作を示し、アフォーダンス境界の存在を示していることを発見しました。
この境界の位置は、ChatGPT-4 によって応答される自身の身体サイズ (人間の平均身長) に対応します。
ChatGPT は実体を持たず、世界と対話することはできませんが、人間との同様の対話を示します。世界 - オブジェクトのアフォーダンスは人体のサイズに基づいて分割されます。
つまり、ChatGPT は何千冊もの本を読んできたにもかかわらず、何の進歩もしていませんが、自発的に身体スキーマが現れており、この身体スキーマは、人体スキーマモード。
つまり、ChatGPT は人間のように考えることを学んだだけでなく、人間のように行動することも学びました。
研究者らは、さまざまなサイズの言語モデルを比較することで、モデルのサイズが重要な要素であることを発見しました。
BERT や GPT-2 などのより小規模なモデルはアフォーダンス境界の存在を示しませんが、GPT-3.5 と GPT-4 はどちらもアフォーダンス境界を示し、ChatGPT の境界は4 は人間により似ており、これは GPT-4 が GPT-3 よりも多くのパラメーターを持っているという噂と一致します。
したがって、モデルが大きく複雑になればなるほど、一見不可能または無関係に見える関数が多数自動的に出現します。
これが、主要な研究機関がモデルにますます多くのパラメータを追加している理由であり、最初に OpenAI に 1 億米ドルを寄付したマスク氏は、現在、より大規模なモデルのトレーニングに OpenAI を求めています。 』は停止され、「AIゴッドファーザー」ジェフリー・ヒントンはAIに対する恐怖と懸念を公に表明した。
これは、これらの新たな機能が当初の設計を超えており、制御を失う寸前にある可能性があるためです。
#ギャップは定性的なものですか、それとも定量的なものですか?一方、ChatGPT のボディ スキーマの適用能力は完全に人間に似ているわけではなく、まだギャップがあり、そのアフォーダンス境界は人間ほど明確ではありません。
このギャップが、子供と大人の言語能力のギャップのように量的なものである場合、このギャップは時間の経過とともに徐々に埋められると信じる理由があります。継続的な学習、モデル サイズの継続的な増加、またはパラメーターの調整を通じて。
ChatGPT と人間との間の距離は常に縮まり、問題は徐々に解決されます。
しかし、この差がチンパンジーと人間の言語能力の差のように定性的なものであれば、どのような訓練を行っても、どれだけ時間が経過しても、その差は変わらないことになります。能力は決して同じではありません。が埋められます。
したがって、ChatGPT が人間の能力と質的に異なる場合、将来的に実現可能な方向性の 1 つは、ChatGPT に「本体を置く」ことです。
これは、ロボットを ChatGPT と組み合わせて、ナビゲーション、オブジェクト操作、および生存と目標達成に関連するその他のアクションにおける AI 搭載ロボットの機能の開発と画期的な進歩を促進することを意味します。
たとえば、ChatGPT を搭載したロボットは、在宅アシスタント、倉庫管理、医療ケアなど、オブジェクトを理解して操作することで複雑なタスクを実行できます。
もう 1 つのエキサイティングな分野は、ChatGPT と自動運転による思考と理解の能力を組み合わせることです。現在の自動運転は、知覚する能力はあっても、思考・理解する能力が欠如しており、「目はあっても脳なし」といえる。
ChatGPT と自動運転技術の統合により、自動運転技術は現在の L2/L3 レベルから L4、さらには L5 レベルにアップグレードされることが期待されます。
一方、自動車は ChatGPT に本体を与え、世界と真に対話できるようにします。 ChatGPT がもはや「何千冊もの本を読む」だけでなく「何千マイルも旅する」とき、新たな知性と可能性を示すかもしれません。
これは人工知能の次の画期的な方向性になるかもしれません;このとき、火花は草原の火になるかもしれません。
以上がGPT-4のボディはなんと167cm!清華大学と北京師範大学の主な研究: ChatGPT は人間のように行動を認識できるの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。