ホームページ >テクノロジー周辺機器 >AI >「ソーシャルマスター」GPT-4!表現を解釈し、心理を推測する方法を知る

「ソーシャルマスター」GPT-4!表現を解釈し、心理を推測する方法を知る

WBOY
WBOY転載
2023-07-22 20:29:131436ブラウズ

あなたは、活発な会話とグラスのカチャカチャという音で満たされた活気に満ちたカクテル パーティーにいると想像してください。

現時点では、あなたは隅に喜んで隠れて、のんびりと観察しています。しかし、パーティーの中心にいなくても、人々の言語的および非言語的な合図を読み取ることで、さまざまな人々の間の社会的関係を簡単に把握し、何が起こっているのかを理解し、さらには公然および秘密の社会的メッセージを解読することさえできます。

LLM がこのレベルのソーシャル スキルを再現できたらどうなるでしょうか?いいえ、それがココマインドです。

「ソーシャルマスター」GPT-4!表現を解釈し、心理を推測する方法を知る

ビデオを開くだけで、モデルがキャラクターの表情の分析を開始し、キャラクターの感情についての結論を導き出します。

その後、右側のプロンプト列で質問して、AI がビデオ内の社会的パズルの底流をさらに分析できるようにすることもできます。

(正直に言うと、これは難しい人もいます)

「ソーシャルマスター」GPT-4!表現を解釈し、心理を推測する方法を知る写真

Koko Mind には、150 の複雑なマルチパーティのソーシャル インタラクションと自由テキストの質問と回答が含まれています。

データの多様性とスケーラビリティを確保し、データ汚染を回避するために、すべてのソーシャル インタラクション、質問と回答は GPT-4 によって生成され、その後人間の専門家によって検証されます。

分析データは 3 つの異なるソースに基づいています:

  • GPT-4 のみ: このサブセットは GPT のみで構成されています-4 プロンプト経由で作成されます。
  • # 映画に基づく: データ汚染を避けるため、データのこの部分は、2022 年以降に公開された映画から抽出されたさまざまなシーンに基づいています。 GPT-4 はこれらのシーンの形成を担当し、核となる本質を維持しながら独自の要素を追加しました。
  • ToMi に基づく: このセクションには、シミュレートされたデータセット ToMi によってサポートされるデータが含まれています。これには、物理​​的なオブジェクトを別の場所に移動することが含まれます。これは心理的なものです。理論のテスト。もちろん、これらの社会的相互作用は GPT-4 によって修正および拡張される必要があります。
#3 つのデータ ソースの割合は次のとおりです:

写真「ソーシャルマスター」GPT-4!表現を解釈し、心理を推測する方法を知る

それぞれの社会的相互作用について、研究者は社会理解に密接に関連する以下の側面を調査するためにさまざまな質問をします。

    # 心の理論: 他の人の精神状態と視点の理解を評価する質問。

  • 社会規範: 状況における社会的価値観と規範を特定するために設計された質問。

  • 感情認識: 文脈内の感情要素を特定して理解することを目的とした問題。

  • 社会的関係: 対人関係のダイナミクスと人間関係に焦点を当てます。

  • 反事実的な質問: 別の結果や可能性を探ることを目的とした仮説的な質問。

  • ソーシャル アドバイス: 特定の状況に関連したアドバイスや推奨行動を提案する質問。
研究者らは、AlpacaEval 後のさまざまなモデルを評価するための参照として text-davinci-003 を使用しました。

研究者らは、括弧内の非言語的手がかり (例: 緊張してコーヒーを飲むなど) を文脈から削除しました。

以下は興味深い点です:

    2 つのモデルのうち、Claude と比較して、GPT-4 はより高い確実性を示し、勝てるモデルを特定する自信。

  • コンテキストに非言語的な手がかりがなく、インタラクションが完全に GPT-4 によって生成されているか映画に基づいている場合、クロードは GPT-4 よりも優れたパフォーマンスを発揮します。 4.

  • そして、コンテキストに非言語的な手がかりが含まれている場合、GPT-4 は常にクロードよりも優れています。
  • # (考えられる説明の 1 つは、GPT-4 が追加の非言語情報をよりよく理解できるマルチモーダル モデルであるということです。)

ブログでは、研究者は各モデルのパフォーマンスを明確に確認するために表を描きました。

「ソーシャルマスター」GPT-4!表現を解釈し、心理を推測する方法を知る写真

結果は、多くの点で刺激的ですが、一定の制限もあります。まず、ココ マインドは比較的小規模であるため、研究者の結論の広範な適用性と包括性が制限される可能性があります。

第 2 に、Koko Mind のすべてのインタラクションは GPT-4 によって生成され、手動による検証が必要なため、データセットの拡張が困難になります。

また、Koko Mind は人間が検証した回答をデータセットで提供していますが、研究者は評価する際にこれらの回答を参考として使用しておらず、これらの回答は GPT-4 によって生成されているため、そのため、GPT-4 に偏っている可能性があります。

将来の研究は、人間が検証し、機械が生成した参照回答に基づいてモデルを評価する方法に焦点を当てる可能性があります。

もちろん、何らかの制限があるにもかかわらず、研究者は依然としてココ マインドを社会的知性、マルチモーダル言語モデルなどに関連する将来の研究への出発点とみなしています。

以上が「ソーシャルマスター」GPT-4!表現を解釈し、心理を推測する方法を知るの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。