首頁  >  文章  >  科技週邊  >  楊笛一新作:社恐有救了,AI大模型一對一陪聊,幫i人變成e人

楊笛一新作:社恐有救了,AI大模型一對一陪聊,幫i人變成e人

WBOY
WBOY轉載
2024-04-09 16:49:011298瀏覽
在社交活動中,大語言模型既可以是你的合作夥伴(partner),也可以成為你的導師(mentor)。

在人類的社交活動中,為了更有效地在工作和生活中與他人溝通,需要一定的社交技能,例如解決衝突。

然而,社交技能的練習環境對大多數人來說通常是遙不可及的。特別是由專家訓練這些技能時,往往耗時、投入高且可用性有限。現有的練習和回饋機制很大程度上依賴專家監督,使訓練難以擴展。此外,經過專業訓練的教練也缺乏,而大多數可以提供客製化回饋的教練無法幫助大量有需要的人。

近日,在由史丹佛助理教授楊笛一為共同一作的論文《Social Skill Training with Large Language Models》中,研究者認為,借助大語言模型可以使得社交技能訓練變得更容易、更安全、更有吸引力,並在現實、虛擬練習空間中提供量身定制的回饋。

楊笛一新作:社恐有救了,AI大模型一對一陪聊,幫i人變成e人

論文網址:https://arxiv.org/pdf/2404.04204.pdf

具體來講,研究者提出了以下兩種社交技能訓練框架。

第一個訓練框架是 AI Partner,它可以透過模擬練習為體驗式訓練提供可擴展的解決方案。先前已經有研究表明,人類角色扮演可以有效地教導溝通、合作和領導技能。與 on-the-job 訓練相比,模擬可以讓學習者承擔更少的風險和機會成本。而透過模擬,AI Partner 將減少進入專業領域的社會經濟障礙。

第二個補充訓練框架是 AI Mentor, 它將根據領域專業知識和事實知識提供個人化回饋。

這兩個訓練框架(合稱為 APAM)都可以將體驗式學習與現實練習、客製化回饋結合。研究者呼籲透過跨學科創新來解決 APAM 的廣泛影響。

論文作者楊笛一表示:「學習社交技能對大多數人來說是遙不可及的,我們如何讓社交技能訓練變得更容易實現?基於此,我們推出APAM,其利用LLM 透過現實實踐和量身定制的反饋進行社交技能訓練!」

楊笛一新作:社恐有救了,AI大模型一對一陪聊,幫i人變成e人

她接著表示:「在APAM 中,當使用者想要學習一項新的社交技能時,AI Partner 可以幫助他們透過模擬對話來練習相關場景。AI Mentor 可以在模擬的關鍵時刻提供基於知識的回饋。」

楊笛一新作:社恐有救了,AI大模型一對一陪聊,幫i人變成e人

APAM 架構概覽

#該研究提出了一個通用框架專門用於社交技能訓練,該框架包括AI Partner 和AI Mentor(兩者簡稱APAM),而這兩者至關重要。當使用者想要學習一項新的社交技能時,AI Partner 可以透過模擬對話幫助他們練習相關場景。 AI Mentor 可以在模擬的關鍵時刻提供基於知識的回饋。

楊笛一新作:社恐有救了,AI大模型一對一陪聊,幫i人變成e人

然而,建構和部署 AI Partner 並非易事,例如很難保持模擬人物的風格、行為和情感特徵的一致性。而開發 AI Mentor 在很大程度上依賴領域專業知識、情境感知和回饋效率等因素。

為了解決上述問題,研究者提出透過LLM 進行社交技能訓練的通用方法,分四個步驟完成:

  1. 了解如何解決問題的技能(例如,解決衝突);
  2. 設計一個AI partner 來模擬對話,讓學習者(即使用者)接觸目標過程,進行練習; 
  3. 建立一個AI mentor 來提供回饋; 
  4. 將這兩個智能體整合到模擬環境中,以便使用者學習。 

研究者表示,APAM 框架的理想受眾是初學者,但有經驗的人也可以使用 APAM 系統來刷新他們的知識。

APAM 可以在許多領域提高學習者的技能,表 1 列舉了一些應用場景,例如如何傾聽、心理健康諮商等。不過 APAM 框架不僅限於這些典型的例子,論文第 6 節有更多的介紹。

楊笛一新作:社恐有救了,AI大模型一對一陪聊,幫i人變成e人

雖然 LLM 作為社交技能訓練工具潛力巨大,因為它們可以產生連貫且自然的文本。然而,這種靈活性往往伴隨著有限的可控性。

出於安全考慮, APAM 框架為如何應用AI 提供了一系列措施,他們將使用流程分解為一個連續體:AI Partner 連續體以及AI Mentor 連續體,每個連續體都由三個模型完成(如圖1 所示)。

評估結果

#AI partner 和AI mentor 的評估是一個重大挑戰,基於APAM 的工具涉及複雜的計算系統以及與不同需求和背景的使用者的互動。

為了將這些訓練工具開發為一個領域,評估措施需要超越自然語言處理中傳統的指標,轉而採用來自多個相關領域和利害關係人的方案。納入多學科視角將有助於評估此類系統的實證效能、基於使用者角度的可用性以及對使用者和社群的長期影響。

目前,文字產生的研究主要集中在內部評估上,即透過預先定義的規則或交互作用來評估輸出的品質。

在下表 2 中,研究者主要分為全自動評估和使用者驅動評估。基於參考的指標(如困惑度或 Kullback-Leibler 散度)通常用於系統品質自動評估,它們既簡單又允許透過演示對所需行為進行豐富的定義。

表 2 詳細列出了以往工作中適用於 APAM 系統的內在和外在評估程序。目前,自然語言處理從業者主要關注對系統的內在評估。本文中,研究者強調使用既定的教育成果衡量標準來評估 APAM 系統的重要性。

楊笛一新作:社恐有救了,AI大模型一對一陪聊,幫i人變成e人

更多細節請參考原文。

以上是楊笛一新作:社恐有救了,AI大模型一對一陪聊,幫i人變成e人的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:jiqizhixin.com。如有侵權,請聯絡admin@php.cn刪除