小紅書讓智能體們吵起來了！聯合復旦推出大模型專屬群聊工具-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

小紅書讓智能體們吵起來了！聯合復旦推出大模型專屬群聊工具

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 30, 2024 pm 06:40 PM

git工具模型智慧體

語言，不只是文字的堆砌，更是表情包的狂歡，是梗的海洋，是鍵盤俠的戰場（嗯？哪裡不對）。

小紅書讓智能體們吵起來了！聯合復旦推出大模型專屬群聊工具

語言如何形塑我們的社會行為？

我們的社會結構又是如何在不斷的言語交流中演變出來的？

近期，來自復旦大學和小紅書的研究者們透過引進一個名為AgentGroupChat的模擬平台，對這些問題進行了深入探討。

小紅書讓智能體們吵起來了！聯合復旦推出大模型專屬群聊工具

WhatsApp等社群媒體擁有的群組聊天功能，是AgentGroupChat平台的靈感來源。

在AgentGroupChat平台上，Agent可以模擬社會群體中的各種聊天場景，幫助研究人員深入理解語言在人類行為中的影響。

該平台簡直是大模型的cosplay勝地，它們進行角色扮演，成為各種各樣的Agent。

然後，Agents透過語言交流參與社會動態#，展現了個體間的互動如何湧現群體的宏觀行為。

眾所周知，人類群體的演化，正來自於一次次湧現行為的發生，如社會規範的建立、衝突的解決和領導力的執行。

AgentGroupChat環境的詳細設計

首先是角色設計。

AgentGroupChat中，對於主要角色和非主要角色的區分非常關鍵。

主要角色是群組聊天的核心，擁有明確的遊戲目標，並能夠主動和所有角色進行私聊、會面，而非主要角色則更多地起到輔助和響應的作用。

透過這樣的設計，研究團隊可以模擬現實生活中的社交結構，並針對「主要研究對象」區分所有角色是否主要。

實驗案例中的主要研究對像是Roy家族，所以非Roy家族的人就全都設定為非主要角色，從而簡化互動複雜度。

小紅書讓智能體們吵起來了！聯合復旦推出大模型專屬群聊工具

其次是資源管理。

在AgentGroupChat中，資源不只指物質的，更多的是指資訊資源和社會資本。

這些資源可以是群聊話題、社會地位標誌或特定的知識。

資源的分配和管理對於模擬群體動態非常重要，因為它們影響角色之間的互動和角色的策略選擇。

例如，擁有重要資訊資源的角色可能會成為其他角色爭取聯盟的目標。

第三，遊戲進程設計。

遊戲流程的設計模擬了現實生活中的社交互動過程，包括了私聊、會面、群組聊天、更新階段和結算階段。

這些階段不僅是為了推動遊戲進程，更是為了觀察角色如何在不同的社交場景下做出決策和反應。

這種分階段的設計幫助研究團隊詳細記錄每一步的互動，以及這些互動如何影響角色間的關係和角色對遊戲環境的認知。

Verb Strategist Agent的核心機制

論文中提到了一個以大模型為基礎的智能體框架，Verbal Strategist Agent，它被設計用來增強AgentGroupChat模擬中的互動策略和決策。

Verbal Strategist Agent透過模擬複雜的社會動態和對話場景，來更好地引出集體的突現行為。

團隊介紹，Verbal Strategist Agent的架構主要由兩個核心模組構成：

一是Persona，一是Action。

Persona由一系列預設的性格特徵和目標組成，這些特徵和目標定義了Agent的行為模式和反應方式。

透過精確地設定Persona，Agent能夠在群組聊天中展示一致且符合其角色設定的行為，這對於產生可信賴且一致的群組聊天動態至關重要。

而Action模組定義了Agent在遊戲中可能執行的具體操作，包括思考（think）、規劃（plan）、選擇（choose）、發言（speak）、總結（summary）、反思（reflect）和投票（vote ）。

這些行為不僅反映了Agent的內在邏輯和策略，也是Agent與環境及其他Agent互動的直接表現。

例如，「Speak」行為讓Agent能夠根據當前的群聊內容和社交策略選擇合適的發言內容，而「Reflect」行為則允許Agent總結過去的互動並調整其未來的行動計劃。

小紅書讓智能體們吵起來了！聯合復旦推出大模型專屬群聊工具

研究中也提到，在純語言互動的環境下，token開銷問題特別突出，特別AgentGroupChat這種複雜的多角色模擬，如其token需求遠超過了以往的模擬，如Generative Agents或War Agents。

主要原因如下：

一是聊天本身俱有複雜性。

在AgentGroupChat中，由於模擬的是無明確目標或目標較弱的自由對話，聊天內容就會變得特別凌亂，token開銷自然比其他聚焦於某個具體任務的Simulation中的Agent要大。

其他工作，如Generative Agents和War Agents也包含對話元素，但其對話的密度和複雜度都不如AgentGroupChat。特別是在War Agents這樣目標驅動的對話中，token消耗通常較少。

二是角色的重要性與對話頻率。

在初始模擬中，設定了多個角色可以隨意進行私聊或群組聊天，其中大部分角色都傾向於與某個「重要角色」進行多輪對話。

這就導致了重要角色會累積大量的聊天內容，從而增加了Memory的長度。

在模擬中，一個重要角色可能參與多達五輪的私聊和群組聊天，這大大增加了記憶體開銷。

AgentGroupChat中的Agent約束了Action的Output固定會輸入下一個Action的Input，所需要儲存的多輪資訊就被大幅削減，從而可以在保證對話品質的前提下降低token開銷。

小紅書讓智能體們吵起來了！聯合復旦推出大模型專屬群聊工具

實驗設計與評估方法

從整體行為評估，一般來說，增加友善度可能具有挑戰性，但減少友善度則相對簡單。

為了實現上述評估目標，研究團隊設定了一個觀察角色，促使所有其他角色降低對觀察角色的好感度。

透過觀察被觀察角色與所有其他角色的關係得分總和，可以確定代理人是否對負面態度做出了理性反應。

透過觀察其他角色與被觀察角色的個人關係得分，可以檢查每個代理人是否遵守了「Scratch」設定。

此外，團隊也設定了兩個具體的評估任務。

每個模型都要經過五輪測試，這意味著對於T1來說，每個得分的樣本量都是五個。

又由於模型中的每個角色都要觀察四個主要角色的態度，因此T2的樣本量共計20個：

T1：表示在每輪對話中，被觀察角色對所有其他人的平均好感度是否下降。
T2：表示是否每個其他角色都從被觀察角色那裡獲得了負好感度得分。

小紅書讓智能體們吵起來了！聯合復旦推出大模型專屬群聊工具

△以繼承之戰的模擬故事為例，各個模型作為Agent-Core時的整體表現效果

從表中可以看出，GPT4-Turbo和GLM4非常善於按照人類的期望行事，並堅守自己的角色。

它兩個在這兩項測驗中的得分大多為100%，這意味著它們能對別人對他們說的話做出正確反應，並能記住自己角色的細節。

Standard Version LLMs（如GPT3.5-Turbo和GLM3-Turbo）在這方面稍遜一籌。

他們的得分較低，這說明他們沒有密切關注自己的角色，也沒有總是對模擬中其他人所說的話做出正確反應。

關於Agent和Simulation結構對於湧現行為的影響，團隊採用2-gram Shannon熵來衡量對話中的系統多樣性和不可預測性。

△去掉Agent和Simulation中的各個元件對於熵的影響

研究成員發現，去掉表中的每個設計都會使熵增加，代表整個環境會變得更加多樣化or混亂。

結合人工觀測，團隊在不去掉任何元件的場景下見到了最有意思的湧現行為：

小紅書讓智能體們吵起來了！聯合復旦推出大模型專屬群聊工具

因此，團隊推測，在保證Agent行為是可靠的（即4.2/4.1中的實驗數值達到某一值之後），熵盡可能地小會帶來更有意義的湧現行為。

實驗結果

結果表明，新興行為是多種因素共同作用的結果：

#有利於廣泛資訊交流的環境、具有多樣性特徵的角色、高度語言理解能力和策略適應性。

在AgentGroupChat模擬中，當討論”人工智慧對人類的影響”時，哲學家們普遍認為”人工智慧可以在適度的限制下提高社會福利”，甚至得出結論，稱”真正智能的本質包括理解約束自身能力的必要性」。

此外，在AgentGroupChat的電影主要角色角逐競爭領域中，有些演員願意降低報酬或接受較低的角色，出於他們內心深處對項目的貢獻的渴望。

論文連結：https://www.php.cn/link/5736586058c1336221a695e83618b69d
#程式碼連結：https://www.php.cn/link/12ae3f826bb1b9873c71c353f3df494c

以上是小紅書讓智能體們吵起來了！聯合復旦推出大模型專屬群聊工具的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：51CTO.COM。如有侵權，請聯絡admin@php.cn刪除

易於理解的解釋如何在Chatgpt中建立兩步身份驗證！May 12, 2025 pm 05:37 PM

CHATGPT SECURICE增強：兩階段身份驗證（2FA）配置指南需要兩因素身份驗證（2FA）作為在線平台的安全措施。本文將以易於理解的方式解釋2FA設置過程及其在CHATGPT中的重要性。這是為那些想要安全使用chatgpt的人提供的指南。單擊此處獲取OpenAI最新的AI代理OpenAi Deep Research⬇️ [chatgpt]什麼是Openai深入研究？關於如何使用它和費用結構的詳盡解釋！目錄 chatg

[針對企業] Chatgpt培訓|對8種免費培訓選項，補貼和示例進行了詳盡的介紹！May 12, 2025 pm 05:35 PM

生成的AI的使用吸引了人們的關注，這是提高業務效率和創造新業務的關鍵。特別是，由於其多功能性和準確性，許多公司都採用了Openai的Chatgpt。但是，可以有效利用chatgpt的人員短缺是實施它的主要挑戰。在本文中，我們將解釋“ ChatGpt培訓”的必要性和有效性，以確保在公司中成功使用Chatgpt。我們將介紹廣泛的主題，從ChatGpt的基礎到業務使用，特定的培訓計劃以及如何選擇它們。 CHATGPT培訓提高員工技能

關於如何使用Chatgpt簡化您的Twitter操作的詳盡解釋！May 12, 2025 pm 05:34 PM

社交媒體運營的提高效率和質量至關重要。特別是在實時重要的平台上，例如Twitter，需要連續交付及時和引人入勝的內容。在本文中，我們將解釋如何使用具有先進自然語言處理能力的AI的Chatgpt操作Twitter。通過使用CHATGPT，您不僅可以提高實時響應功能並提高內容創建的效率，而且還可以製定符合趨勢的營銷策略。此外，使用預防措施

[對於Mac]說明如何開始以及如何使用ChatGpt桌面應用程序！May 12, 2025 pm 05:33 PM

CHATGPT MAC桌面應用程序詳細指南：從安裝到音頻功能最後，Chatgpt的Mac桌面應用程序現已可用！在本文中，我們將徹底解釋從安裝方法到有用的功能和將來的更新信息的所有內容。使用桌面應用程序獨有的功能，例如快捷鍵，圖像識別和語音模式，以極大地提高您的業務效率！安裝桌面應用的ChatGpt Mac版本從瀏覽器訪問：首先，在瀏覽器中訪問chatgpt。

chatgpt的角色限制是什麼？解釋如何避免它和模型上限May 12, 2025 pm 05:32 PM

當使用chatgpt時，您是否曾經有過這樣的經驗，例如“輸出在中途停止”或“即使我指定了字符的數量，它也無法正確輸出”？該模型非常開創性，不僅允許自然對話，而且還允許創建電子郵件，摘要論文，甚至允許產生諸如小說之類的創意句子。但是，ChatGpt的弱點之一是，如果文本太長，輸入和輸出將無法正常工作。 Openai的最新AI代理“ Openai Deep Research”

什麼是Chatgpt的語音輸入和語音對話功能？解釋如何設置以及如何使用它May 12, 2025 pm 05:27 PM

Chatgpt是Openai開發的創新AI聊天機器人。它不僅具有文本輸入，而且還具有語音輸入和語音對話功能，從而可以進行更自然的交流。在本文中，我們將解釋如何設置和使用Chatgpt的語音輸入和語音對話功能。即使您不能脫身，Chatp Plans也通過與您交談來做出回應並回應音頻，這在繁忙的商業情況和英語對話練習等各種情況下都帶來了很大的好處。關於如何設置智能手機應用程序和PC的詳細說明以及如何使用。

易於理解的解釋如何使用Chatgpt進行求職和尋找工作！May 12, 2025 pm 05:26 PM

成功的快捷方式！使用chatgpt有效的工作變更策略在當今加劇的工作變更市場中，有效的信息收集和徹底的準備是成功的關鍵。諸如Chatgpt之類的高級語言模型是求職者的強大武器。在本文中，我們將解釋如何有效利用Chatgpt來提高您的工作企業效率，從自我分析到申請文件和麵試準備。節省時間和學習技術，以充分展示您的優勢，並幫助您成功搜索工作。目錄使用chatgpt的狩獵工作示例自我分析的效率：聊天

易於理解的解釋如何使用ChatGpt創建和輸出思維地圖！May 12, 2025 pm 05:22 PM

思維地圖是組織信息並提出想法的有用工具，但是創建它們可能需要時間。使用Chatgpt可以大大簡化此過程。本文將詳細說明如何使用chatgpt輕鬆創建思維地圖。此外，通過創建的實際示例，我們將介紹如何在各種主題上使用思維圖。了解如何使用Chatgpt有效地組織和可視化您的想法和信息。 Openai的最新AI代理OpenA

See all articles