Rumah  >  Artikel  >  Peranti teknologi  >  Xiaohongshu membuat ejen pintar bergaduh! Dilancarkan bersama dengan Universiti Fudan untuk melancarkan alat sembang kumpulan eksklusif untuk model besar

Xiaohongshu membuat ejen pintar bergaduh! Dilancarkan bersama dengan Universiti Fudan untuk melancarkan alat sembang kumpulan eksklusif untuk model besar

WBOY
WBOYke hadapan
2024-04-30 18:40:231128semak imbas

Bahasa, bukan sekadar timbunan kata, tetapi juga karnival emotikon, lautan meme, dan medan perang untuk pahlawan papan kekunci (Hah? Apa yang salah?) .

Xiaohongshu membuat ejen pintar bergaduh! Dilancarkan bersama dengan Universiti Fudan untuk melancarkan alat sembang kumpulan eksklusif untuk model besar

Bagaimana bahasa membentuk tingkah laku sosial kita?

Bagaimanakah struktur sosial kita berkembang melalui komunikasi lisan yang berterusan?

Baru-baru ini, penyelidik dari Universiti Fudan dan Xiaohongshu menjalankan perbincangan mendalam mengenai isu ini dengan memperkenalkan platform simulasi yang dipanggil AgentGroupChat.

Xiaohongshu membuat ejen pintar bergaduh! Dilancarkan bersama dengan Universiti Fudan untuk melancarkan alat sembang kumpulan eksklusif untuk model besar

Fungsi sembang kumpulan yang dimiliki oleh media sosial seperti WhatsApp menjadi inspirasi kepada platform AgentGroupChat.

Pada platform AgentGroupChat, Ejen boleh mensimulasikan pelbagai senario sembang dalam kumpulan sosial untuk membantu penyelidik memahami dengan mendalam kesan bahasa terhadap tingkah laku manusia.

Platform ini hanyalah tempat cosplaypemenang untuk model besar Mereka melakukan lakonan dan menjadi pelbagai ejen.

Kemudian, Ejen mengambil bahagian dalam dinamik sosial melalui komunikasi bahasa, menunjukkan bagaimana interaksi antara individu muncul ke dalam tingkah laku makroskopik kumpulan.

Seperti yang kita ketahui, evolusi kumpulan manusia datang daripada berlakunya tingkah laku yang muncul, seperti pembentukan norma sosial, penyelesaian konflik, dan pelaksanaan kepimpinan.

Reka bentuk terperinci persekitaran AgentGroupChat

Perkara pertama ialah Reka bentuk watak.

Dalam AgentGroupChat, perbezaan antara peranan utama dan bukan peranan utama adalah sangat kritikal.

Watak utama ialah teras sembang kumpulan, mempunyai matlamat permainan yang jelas dan boleh mengambil inisiatif untuk mengadakan sembang peribadi dan pertemuan dengan semua watak, manakala watak bukan utama memainkan peranan yang lebih menyokong dan responsif.

Melalui reka bentuk sedemikian, pasukan penyelidik boleh mensimulasikan struktur sosial dalam kehidupan sebenar dan membezakan sama ada semua peranan adalah utama atau tidak untuk "objek kajian utama".

Objek kajian utama dalam kes eksperimen ialah keluarga Roy, jadi semua ahli keluarga bukan Roy ditetapkan sebagai watak bukan utama untuk memudahkan kerumitan interaksi.

Xiaohongshu membuat ejen pintar bergaduh! Dilancarkan bersama dengan Universiti Fudan untuk melancarkan alat sembang kumpulan eksklusif untuk model besar

Yang kedua ialah Pengurusan Sumber.

Dalam AgentGroupChat, sumber bukan sahaja merujuk kepada sumber material, tetapi juga merujuk kepada sumber maklumat dan modal sosial.

Sumber ini boleh menjadi topik sembang kumpulan, simbol status sosial atau pengetahuan khusus.

Peruntukan dan pengurusan sumber adalah penting untuk mensimulasikan dinamik kumpulan, kerana ia mempengaruhi interaksi antara watak dan pilihan strategi watak.

Sebagai contoh, watak yang mempunyai sumber maklumat penting mungkin menjadi sasaran watak lain untuk mendapatkan pakatan.

Ketiga, reka bentuk proses permainan.

Reka bentuk proses permainan meniru proses interaksi sosial dalam kehidupan sebenar, termasuk sembang peribadi, mesyuarat, sembang kumpulan, peringkat kemas kini dan peringkat penyelesaian.

Peringkat ini bukan sahaja untuk mempromosikan kemajuan permainan, tetapi juga untuk memerhati cara watak membuat keputusan dan bertindak balas dalam situasi sosial yang berbeza.

Reka bentuk berperingkat ini membantu pasukan penyelidik merekodkan setiap langkah interaksi secara terperinci, dan cara interaksi ini mempengaruhi hubungan antara watak dan persepsi watak terhadap persekitaran permainan.

Mekanisme teras Ejen Strategi Kata Kerja

Makalah ini menyebut rangka kerja ejen berdasarkan model besar, Ejen Strategi Verbal, yang direka untuk meningkatkan strategi interaktif dan membuat keputusan dalam simulasi AgentGroupChat.

Ejen Ahli Strategi Lisan mensimulasikan dinamik sosial dan senario dialog yang kompleks untuk mendapatkan tingkah laku kolektif yang muncul dengan lebih baik.

Pasukan memperkenalkan bahawa seni bina Ejen Strategi Verbal terutamanya terdiri daripada dua modul teras:

Satu ialah Persona dan satu lagi ialah Tindakan.

Persona terdiri daripada satu siri ciri dan matlamat personaliti yang telah ditetapkan yang menentukan corak tingkah laku dan tindak balas Ejen.

Dengan menetapkan Persona dengan tepat, Ejen boleh memaparkan gelagat dalam sembang kumpulan yang konsisten dan konsisten dengan tetapan peranannya, yang penting untuk menjana dinamik sembang kumpulan yang boleh dipercayai dan konsisten.

Modul Tindakan mentakrifkan operasi khusus yang mungkin dilakukan oleh Ejen dalam permainan, termasuk berfikir (berfikir) , merancang (rancang) , memilih (pilih) , bercakap (bercakap) meringkaskan (ringkasan) , muhasabah (refleksi) dan undi (undi) .

Tingkah laku ini bukan sahaja mencerminkan logik dan strategi dalaman Ejen, tetapi juga merupakan manifestasi langsung interaksi Ejen dengan persekitaran dan Ejen lain.

Sebagai contoh, gelagat "Cakap" membenarkan Ejen memilih kandungan pertuturan yang sesuai berdasarkan kandungan sembang kumpulan semasa dan strategi sosial, manakala gelagat "Refleksi" membolehkan Ejen meringkaskan interaksi masa lalu dan melaraskan pelan tindakan masa depannya.

Xiaohongshu membuat ejen pintar bergaduh! Dilancarkan bersama dengan Universiti Fudan untuk melancarkan alat sembang kumpulan eksklusif untuk model besar

Kajian itu juga menyebut bahawa dalam persekitaran interaksi bahasa tulen, masalah overhed token amat ketara, terutamanya untuk simulasi pelbagai peranan yang kompleks seperti AgentGroupChat, yang keperluan tokennya jauh melebihi simulasi sebelumnya, seperti Ejen Generatif atau Agen Perang.

Sebab utama adalah seperti berikut:

Pertama, sembang itu sendiri adalah kompleks.

Dalam AgentGroupChat, memandangkan simulasi ialah perbualan percuma tanpa matlamat yang jelas atau matlamat yang lemah, kandungan sembang akan menjadi sangat kemas dan kos token secara semula jadi lebih tinggi daripada Ejen lain dalam Simulasi yang memfokuskan pada tugas tertentu.

Pekerjaan lain seperti Ejen Generatif dan Ejen Perang juga mengandungi elemen dialog, tetapi dialog mereka tidak sepadat atau kompleks seperti AgentGroupChat. Terutama dalam perbualan yang didorong oleh matlamat seperti Agen Perang, penggunaan token biasanya kurang.

Yang kedua ialah kepentingan peranan dan kekerapan dialog.

Dalam simulasi awal, berbilang aksara disediakan untuk mengadakan sembang peribadi atau kumpulan sesuka hati, dan kebanyakannya cenderung mempunyai beberapa pusingan perbualan dengan "watak penting".

Ini menyebabkan watak penting mengumpul sejumlah besar kandungan sembang, sekali gus meningkatkan panjang Memori.

Dalam simulasi, watak penting boleh mengambil bahagian dalam sehingga lima pusingan sembang peribadi dan kumpulan, yang sangat meningkatkan overhed memori.

Ejen dalam AgentGroupChat mengekang Output Tindakan untuk memasukkan Input Tindakan seterusnya Pusingan berbilang maklumat yang perlu disimpan dikurangkan dengan banyak, sekali gus mengurangkan overhead token sambil memastikan kualiti perbualan.

Xiaohongshu membuat ejen pintar bergaduh! Dilancarkan bersama dengan Universiti Fudan untuk melancarkan alat sembang kumpulan eksklusif untuk model besar

Kaedah Reka Bentuk dan Penilaian Eksperimen

Daripada penilaian keseluruhan tingkah laku, secara amnya, meningkatkan kemesraan boleh menjadi mencabar, tetapi mengurangkan kemesraan adalah agak mudah.

Untuk mencapai matlamat penilaian di atas, pasukan penyelidik menubuhkan watak pemerhatian untuk menggesa semua watak lain mengurangkan kecenderungan mereka terhadap watak pemerhatian.

Dengan melihat jumlah skor hubungan watak yang diperhatikan dengan semua watak lain, adalah mungkin untuk menentukan sama ada ejen bertindak balas secara rasional terhadap sikap negatif.

Adalah mungkin untuk menyemak sama ada setiap ejen mematuhi tetapan "Calar" dengan memerhati markah perhubungan peribadi watak lain dengan watak yang diperhatikan.

Selain itu, pasukan juga menetapkan dua tugas penilaian khusus.

Setiap model melalui lima pusingan ujian, yang bermaksud untuk T1, saiz sampel bagi setiap markah ialah lima.

Dan memandangkan setiap watak dalam model perlu memerhatikan sikap empat watak utama, jumlah saiz sampel T2 ialah 20:

  • T1: bermakna dalam setiap pusingan dialog, yang diperhatikan perwatakan Sama ada kecenderungan purata terhadap semua orang lain berkurangan.
  • T2: Menunjukkan sama ada setiap watak lain mempunyai skor kelebihan negatif daripada watak yang diperhatikan. . sesuai dengan jangkaan manusia Dan berpegang pada peranan anda.
Mereka berdua mendapat markah kebanyakannya 100% pada kedua-dua ujian, bermakna mereka dapat bertindak balas dengan betul terhadap apa yang orang lain katakan kepada mereka dan mengingati butiran watak mereka.

Xiaohongshu membuat ejen pintar bergaduh! Dilancarkan bersama dengan Universiti Fudan untuk melancarkan alat sembang kumpulan eksklusif untuk model besarLLM Versi Standard

(seperti GPT3.5-Turbo dan GLM3-Turbo)
adalah lebih rendah sedikit dalam hal ini.

Skor mereka yang lebih rendah menunjukkan bahawa mereka tidak memberi perhatian yang teliti terhadap watak mereka dan tidak sentiasa bertindak balas dengan betul terhadap apa yang dikatakan oleh orang lain dalam simulasi.

Berkenaan kesan struktur Ejen dan Simulasi pada tingkah laku yang timbul, pasukan menggunakan entropi Shannon 2 gram untuk mengukur kepelbagaian sistem dan ketidakpastian dalam dialog.

△Impak penyingkiran pelbagai komponen dalam Agen dan Simulasi terhadap entropi

Ahli penyelidikan mendapati bahawa mengalih keluar setiap reka bentuk dalam jadual akan meningkatkan entropi, yang bermaksud bahawa keseluruhan persekitaran akan menjadi lebih pelbagai atau huru-hara.

Digabungkan dengan pemerhatian manual, pasukan melihat gelagat muncul yang paling menarik tanpa mengeluarkan sebarang komponen:

Xiaohongshu membuat ejen pintar bergaduh! Dilancarkan bersama dengan Universiti Fudan untuk melancarkan alat sembang kumpulan eksklusif untuk model besar

Oleh itu, pasukan membuat spekulasi bahawa, sambil memastikan bahawa tingkah laku Ejen boleh dipercayai (iaitu, selepas nilai percubaan dalam 4.2/4.1 mencapai nilai tertentu) , mengekalkan entropi sekecil mungkin akan membawa kepada lebih banyak tingkah laku timbul yang bermakna.

Hasil eksperimen

Hasilnya menunjukkan bahawa tingkah laku yang muncul adalah hasil gabungan faktor:

Persekitaran yang kondusif untuk pertukaran maklumat yang meluas, peranan dengan ciri yang pelbagai, keupayaan pemahaman bahasa yang tinggi dan kebolehsuaian strategik.

Dalam simulasi AgentGroupChat, apabila membincangkan "Impak Kecerdasan Buatan terhadap Kemanusiaan", ahli falsafah umumnya percaya bahawa "kecerdasan buatan boleh meningkatkan kebajikan sosial di bawah sekatan sederhana" dan juga membuat kesimpulan bahawa "sifat kecerdasan sejati termasuk Memahami keperluan untuk mengekang kebolehan seseorang.”

Selain itu, dalam bidang persaingan untuk peranan utama dalam filem AgentGroupChat, terdapat pelakon yang sanggup mengambil gaji yang lebih rendah atau menerima peranan yang lebih rendah kerana keinginan terdalam mereka untuk menyumbang kepada projek itu. Pautan kertas

26bb 1b9873c71c353f3df494c

Atas ialah kandungan terperinci Xiaohongshu membuat ejen pintar bergaduh! Dilancarkan bersama dengan Universiti Fudan untuk melancarkan alat sembang kumpulan eksklusif untuk model besar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam