大型モデルを使用して性格/うつ病/認知モデルをテストします。ゲームのプロット開発を通じて心理的特性を測定する-AI-php.cn

ホームページ

テクノロジー周辺機器

大型モデルを使用して性格/うつ病/認知モデルをテストします。ゲームのプロット開発を通じて心理的特性を測定する

王林

Mar 13, 2024 pm 02:07 PM

モデル研究

心理測定は、メンタルヘルス、自己理解、個人の成長において重要な役割を果たします。

従来の心理測定法は、主に参加者が自己報告アンケートに記入することに依存しており、日常生活での行動や感情を思い出すことで測定されます。

このような測定方法は効率的で便利ですが、参加者間の抵抗を誘発し、測定への意欲を低下させる可能性があります。

大規模な言語モデル (LLM)の開発により、LLMは安定した性格特性を示し、人間の微妙な感情や認知パターンを模倣し、さまざまな社会的言語モデルを支援できることが多くの研究でわかっています。科学シミュレーション実験は、教育心理学、社会心理学、文化心理学、臨床心理学、心理カウンセリングなどの多くの心理学研究分野に新しい研究アイデアを提供します。

最近、清華大学の研究チームは、大規模な言語モデルに基づくマルチエージェントシステムに基づく革新的な 心理測定パラダイムを提案しました。

大型モデルを使用して性格/うつ病/認知モデルをテストします。ゲームのプロット開発を通じて心理的特性を測定する

従来の自己報告アンケートとは異なり、この研究では、各参加者、ユーザー向けにカスタマイズされたインタラクティブな物語型のゲームが生成されます。 ゲームの種類とテーマをカスタマイズできます。

ゲームのプロットが展開するにつれて、参加者は一人称視点でさまざまなプロットに基づいてさまざまな選択をする必要があり、それによってプロットの進行に影響を与えます。ゲームの重要な瞬間における参加者の選択を研究することで、彼らの心理的特徴を評価することができます。

△自己申告アンケートの心理測定パラダイム（左）と対話型物語ゲームの心理測定パラダイム（右）の比較

この研究の貢献主に 3 つの側面に反映されています:

は、新しい心理測定パラダイムを提案し、従来のアンケートをゲームベースのインタラクティブな測定に変換します。心理測定の信頼性と妥当性を確保することに基づいて、参加者の感覚を高めます。没入感を高め、テスト体験を向上させます。
ゲーミフィケーションの測定を実現するために、この研究では、PsychoGAT (心理学) という名前の大規模言語モデルに基づくマルチエージェントインタラクションフレームワークを提案します。 Game AgentTs) により、心理テストのシナリオの一般化と、さまざまなゲーム設定下での測定の堅牢性が保証されます。
この研究では、自動化されたシミュレーション評価と実際の人物による評価を通じて、MBTI 性格テスト、PHQ-9 うつ病測定、認知的思考トラップテストなどのタスクに関する心理統計的指標とユーザーエクスペリエンス指標の両方を達成しました。。

次に、研究の詳細を見てみましょう。

PsychoGAT とはどのようなものですか?

△PsychoGAT フレームワーク図

エージェント対話プロセス:

従来の心理テストのアンケートを基に、参加者はゲームの種類とテーマをカスタマイズし、その後、ゲームデザイナーエージェントが全体的なゲームデザインの概要を説明します。

次に、ゲームコントローラー

(ゲームコントローラー) エージェントが特定のゲームプロットを生成し、その過程で批評家 (批評家) エージェントが管理者にコメントします。生成されたコンテンツは複数回のレビューと最適化を受けます。最適化されたゲームプロットが参加者に表示されます。参加者が対応する選択を行った後、管理者はこの対話型プロセスサイクルに従って、この選択に基づいてプロットの開発を促進します。

各エージェントの機能の詳細:

ゲームデザイナー(ゲームデザイナー): CoT テクノロジーを使用して、最初に人物の物語ゲームの概要と、現在測定されている心理的特性を参加者が示すことを可能にする状況がストーリーラインに含まれていることを確認します。

同時に、標準的な心理的自己報告アンケートが現在のゲームのストーリーラインに合わせて調整され、2 つの統合がより自然かつスムーズになります。

ゲームコントローラー(ゲームコントローラー): 適応されたアンケートは、ゲームのストーリーラインに従って順番にインスタンス化され、ノードをプロットし、参加者が選択できるオプションを提供します。

同時に、ゲーム管理者は参加者の選択をゲーム環境に戻し、参加者の選択に基づいてゲームのストーリーの傾向を制御します。ゲームプロットの継続性を実現するために、管理者エージェントは「メモリ更新」メカニズムを採用します。

コメンテーター （批評家）: ゲーム管理者によって生成されたコンテンツをレビューし、最適化することを目的としています。

主に次の 3 つの問題を対象としています。

1) 一貫性の最適化 : ゲームのプロットが進むにつれて、長いテキストの問題がより深刻になり、「メモリ更新」メカニズムも、プロットの一貫性を完全に保証することはできません。

2)公平性を確保する: 参加者の選択はゲームのプロットの展開に影響しますが、参加者が選択する前に、管理者は、たとえ参加者が選択したとしても、プロットの方向性を事前に設定すべきではありません。以前の選択において明確な好みを示しました。

3)不足項目の修正: 管理者が作成したゲームプロットを詳細にレビューし、基本的なゲームへの没入感があるかどうかを確認します。

実験と結果

△3 つの一般的な心理測定パラダイムの比較: 従来のアンケート、心理学者へのインタビュー、およびこの研究で提案されたゲーミフィケーションの評価。

ここで言及されているのはすべて AI に基づく自動測定です。特に心理学者の面接は、大規模な言語モデルと組み合わせられ、大規模な言語モデルが心理学者の役割を果たす現在の面接パラダイムを指します。 . .

実験段階で研究者らは、MBTI 性格検査における外向性、PHQ-9 うつ病の検出、CBT 療法の初期段階での認知の歪みの検出という 3 つの一般的な心理測定タスクを選択しました。

まず、研究者らは、研究の心理測定の信頼性と妥当性をテストするために、それを成熟した伝統的な心理アンケートと比較しました。さらに、他の 3 つの自動測定方法と比較して、さまざまな測定方法のユーザーエクスペリエンスを調査します。

研究者らはまず GPT-4 を使用して被験者をシミュレーションし、さまざまな測定方法を使用して測定プロセスと測定結果を記録しました。これらの測定記録は、その後の心理測定の信頼性および妥当性指標、およびユーザーエクスペリエンス指標を計算するために使用されました。

評価指標には、信頼性・妥当性指標とユーザーエクスペリエンス指標の2つがあります。

信頼性と妥当性の指標: 心理測定学では、測定ツールが科学的であるかどうかを評価するために、一般に信頼性(信頼性)と妥当性#に基づきます。 ##(妥当性)2 次元で検証します。

この研究では、信頼性の指標として内部一貫性を測定するために、クロンバックのアルファとグットマンのラムダ 6 という 2 つの統計量が選択され、ピアソン係数がそれぞれ集約を測定するための妥当性の指標として使用されました。 ## (収束妥当性)

と判別妥当性 (判別妥当性) 。

、手動で評価される指標には以下が含まれます:

(コヒーレンス、スイス)

:コンテンツのロジックが一貫している; 2) インタラクティブ性 (インタラクティブ性、IA)
: ユーザーの選択に対して適切かつ公平な応答があるかどうか; 3) 関心 (関心、INT)
: 測定プロセスが興味深いかどうか; 4) 没入感 (没入、IM)
: 測定プロセスによって参加者が没頭できるかどうか; 5) 満足度 (満足度) 、ST)
: プロセスに対する満足度の全体的な測定。以下は実験結果です。

まず、本研究で提案したPsychoGATが適格な心理測定ツールとして利用できるかどうかを検証した結果を下表に示します。

△PsychoGAT の信頼性と妥当性テストの結果 (合格、良好、優れた)

さらに研究者は、ユーザーのさまざまな心理測定を比較しました。このパラダイムの経験を踏まえると、この研究で提案されたゲーム化された評価は、インタラクティブ性、楽しさ、没入感の点で他の方法よりも大幅に優れています:

△PsychoGAT のユーザーエクスペリエンスの結果は、次のようになります。他の比較方法の対応する結果と同様に

手動評価の有効性を確保するために、研究者は手動評価結果を計算し、PsychoGATの各指標における評価の一貫性は他の方法より優れています:

△PsychoGAT のユーザーエクスペリエンス指標は、手動評価における比較方法の一貫性によるものです。

PsychoGAT をさらに分析するために、研究者はまずさまざまなゲームシナリオを調査しました。ゲーミフィケーション測定の状況、信頼性、妥当性は非常に堅牢です:

△さまざまなゲームシナリオにおける信頼性と妥当性を測定する PsychoGAT の堅牢性

次に、PsychoGAT における各エージェントの役割について検討しました。

△PsychoGAT におけるさまざまなエージェントの役割

最後に、PsychoGAT のゲーム生成コンテンツを視覚的に提示するために、研究者たちはワードクラウドを使用して外向性テストとうつ病を視覚化しました。テスト:

#△PsychoGAT は、外向測定と抑うつ測定のためのゲームシナリオの視覚化を生成します。

外向性テストの内容は主に社会的状況に焦点を当てているのに対し、うつ病テストは個人の思考や感情に焦点を当てています。

研究の詳細については、元の論文を参照してください。

紙のリンク: https://www.php.cn/link/4bcd537b6c034e297f0030cf08887426

以上が大型モデルを使用して性格/うつ病/認知モデルをテストします。ゲームのプロット開発を通じて心理的特性を測定するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

あなたは無知のベールの後ろに職場AIを構築する必要がありますApr 29, 2025 am 11:15 AM

ジョン・ロールズの独創的な1971年の著書「正義の理論」で、彼は私たちが今日のAIデザインの核となり、意思決定を使用するべきであるという思考実験を提案しました：無知のベール。この哲学は、公平性を理解するための簡単なツールを提供し、リーダーがこの理解を使用してAIを公平に設計および実装するための青写真を提供します。あなたが新しい社会のルールを作っていると想像してください。しかし、前提があります。この社会でどのような役割を果たすかは事前にわかりません。過半数または限界少数派に属している、金持ちまたは貧弱、健康、または障害者になることがあります。この「無知のベール」の下で活動することで、ルールメーカーが自分自身に利益をもたらす決定を下すことができません。それどころか、人々はより公衆を策定する意欲があります

決定、決定…実用的な応用AIの次のステップApr 29, 2025 am 11:14 AM

ロボットプロセスオートメーション（RPA）を専門とする多くの企業は、繰り返しタスクを自動化するためのボットを提供しています。一方、プロセスマイニング、オーケストレーション、インテリジェントドキュメント処理スペシャル

エージェントが来ています - 私たちがAIパートナーの隣ですることについてもっとApr 29, 2025 am 11:13 AM

AIの未来は、単純な単語の予測と会話シミュレーションを超えて動いています。 AIエージェントは出現しており、独立したアクションとタスクの完了が可能です。このシフトは、AnthropicのClaudeのようなツールですでに明らかです。 AIエージェント：研究a

共感がAI主導の未来におけるリーダーのコントロールよりも重要である理由Apr 29, 2025 am 11:12 AM

急速な技術の進歩は、仕事の未来に関する将来の見通しの視点を必要とします。 AIが単なる生産性向上を超えて、私たちの社会構造の形成を開始するとどうなりますか？ Topher McDougalの今後の本、Gaia Wakes：

製品分類のためのAI：マシンは税法を習得できますか？Apr 29, 2025 am 11:11 AM

多くの場合、Harmonized System（HS）などのシステムからの「HS 8471.30」などの複雑なコードを含む製品分類は、国際貿易と国内販売に不可欠です。これらのコードは、すべてのINVに影響を与える正しい税申請を保証します

データセンターの要求は、気候技術のリバウンドを引き起こす可能性がありますか？Apr 29, 2025 am 11:10 AM

データセンターと気候技術投資におけるエネルギー消費の将来この記事では、AIが推進するデータセンターのエネルギー消費の急増と気候変動への影響を調査し、この課題に対処するための革新的なソリューションと政策の推奨事項を分析します。エネルギー需要の課題：大規模で超大規模なデータセンターは、数十万の普通の北米の家族の合計に匹敵する巨大な力を消費し、新たなAIの超大規模なセンターは、これよりも数十倍の力を消費します。 2024年の最初の8か月で、Microsoft、Meta、Google、Amazonは、AIデータセンターの建設と運用に約1,250億米ドルを投資しました（JP Morgan、2024）（表1）。エネルギー需要の成長は、挑戦と機会の両方です。カナリアメディアによると、迫り来る電気

AIとハリウッドの次の黄金時代Apr 29, 2025 am 11:09 AM

生成AIは、映画とテレビの制作に革命をもたらしています。 LumaのRay 2モデル、滑走路のGen-4、OpenaiのSora、GoogleのVEO、その他の新しいモデルは、前例のない速度で生成されたビデオの品質を向上させています。これらのモデルは、複雑な特殊効果と現実的なシーンを簡単に作成できます。短いビデオクリップやカメラ認知モーション効果も達成されています。これらのツールの操作と一貫性を改善する必要がありますが、進歩の速度は驚くべきものです。生成ビデオは独立した媒体になりつつあります。アニメーション制作が得意なモデルもあれば、実写画像が得意なモデルもあります。 AdobeのFireflyとMoonvalleyのMAであることは注目に値します

ChatGptはゆっくりとAIの最大のYES-MANになりますか？Apr 29, 2025 am 11:08 AM

ChatGptユーザーエクスペリエンスは低下します：それはモデルの劣化ですか、それともユーザーの期待ですか？最近、多数のCHATGPT有料ユーザーがパフォーマンスの劣化について不満を述べています。ユーザーは、モデルへの応答が遅く、答えが短い、助けの欠如、さらに多くの幻覚を報告しました。一部のユーザーは、ソーシャルメディアに不満を表明し、ChatGptは「お世辞になりすぎて」、重要なフィードバックを提供するのではなく、ユーザービューを検証する傾向があることを指摘しています。これは、ユーザーエクスペリエンスに影響を与えるだけでなく、生産性の低下やコンピューティングリソースの無駄など、企業の顧客に実際の損失をもたらします。パフォーマンスの劣化の証拠多くのユーザーは、特にGPT-4などの古いモデル（今月末にサービスから廃止される）で、ChatGPTパフォーマンスの大幅な分解を報告しています。これ

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。