Pasukan NLP Fudan mengeluarkan gambaran keseluruhan 80 halaman ejen model berskala besar, memberikan gambaran keseluruhan keadaan semasa dan masa depan ejen AI dalam satu artikel-AI-php.cn

Pasukan NLP Fudan mengeluarkan gambaran keseluruhan 80 halaman ejen model berskala besar, memberikan gambaran keseluruhan keadaan semasa dan masa depan ejen AI dalam satu artikel

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Sep 23, 2023 am 09:01 AM

projekagentfudannlp

Baru-baru ini, Pasukan Pemprosesan Bahasa Semulajadi Universiti Fudan (FudanNLP) melancarkan kertas semakan mengenai Agen berasaskan LLM Teks penuh sepanjang 86 halaman dan mempunyai lebih daripada 600 rujukan! Bermula daripada sejarah Ejen AI, pengarang menyusun secara menyeluruh status ejen pintar semasa berdasarkan model bahasa yang besar, termasuk: latar belakang, komposisi, senario aplikasi Ejen berasaskan LLM dan masyarakat ejen yang banyak dibincangkan. Pada masa yang sama, penulis membincangkan isu-isu prospektif dan terbuka yang berkaitan dengan Ejen, yang sangat bernilai untuk trend pembangunan masa depan dalam bidang berkaitan.

Pasukan NLP Fudan mengeluarkan gambaran keseluruhan 80 halaman ejen model berskala besar, memberikan gambaran keseluruhan keadaan semasa dan masa depan ejen AI dalam satu artikel

juga akan menambah "ringkasan satu ayat" untuk setiap kertas yang berkaitan, selamat datang ke gudang Star.

Latar belakang penyelidikan

Sejak sekian lama, penyelidik telah mengejar

kecerdasan buatan

umum (Kecerdasan Am Buatan, AGI) yang setara atau setara. Seawal tahun 1950-an, Alan Turing meluaskan konsep "kepintaran" kepada entiti tiruan dan mencadangkan ujian Turing yang terkenal. Entiti kecerdasan buatan ini sering dipanggil ejen (Agen*). Konsep "agen" berasal dari falsafah dan menggambarkan entiti yang mempunyai keinginan, kepercayaan, niat, dan keupayaan untuk mengambil tindakan. Dalam bidang kecerdasan buatan, istilah ini telah diberi makna baharu: Sebuah entiti pintar dengan ciri-ciri autonomi, kereaktifan, positif dan kebolehmasyarakatan.

* Tiada kata sepakat mengenai terjemahan bahasa Cina bagi istilah Ejen Sesetengah sarjana menterjemahkannya sebagai ejen, pelakon, ejen atau ejen pintar "ejen" dan "ejen pintar" yang kedua-duanya merujuk kepada Ejen.

Sejak itu, reka bentuk ejen telah menjadi tumpuan komuniti kecerdasan buatan. Walau bagaimanapun, kerja lepas terutamanya tertumpu pada meningkatkan kebolehan khusus ejen, seperti penaakulan simbolik atau penguasaan tugas tertentu (catur, Pergi, dll.). Kajian-kajian ini lebih menumpukan pada reka bentuk algoritma dan strategi latihan, sambil mengabaikan pembangunan keupayaan am yang wujud bagi model, seperti ingatan pengetahuan, perancangan jangka panjang, generalisasi yang berkesan dan interaksi yang cekap. Ternyata

meningkatkan keupayaan sedia ada model adalah faktor utama dalam menggalakkan perkembangan selanjutnya ejen pintar.

Kemunculan model bahasa besar (LLM) membawa harapan untuk perkembangan selanjutnya ejen pintar. Jika laluan pembangunan dari NLP ke AGI dibahagikan kepada lima peringkat: korpus, Internet, persepsi, penjelmaan, dan atribut sosial, maka model bahasa berskala besar semasa telah mencapai tahap kedua, dengan input dan output teks berskala Internet. Atas dasar ini, jika Agen berasaskan LLM diberi ruang persepsi dan ruang tindakan, mereka akan mencapai tahap ketiga dan keempat. Tambahan pula, apabila pelbagai ejen berinteraksi dan bekerjasama untuk menyelesaikan tugas yang lebih kompleks, atau mencerminkan tingkah laku sosial dalam dunia sebenar, mereka berpotensi untuk mencapai tahap kelima - masyarakat ejen.

一 Imaginasi pengarang tentang masyarakat harmoni yang terdiri daripada agen pintar juga boleh menyertainya. Adegan ini diambil dari Festival Tanglung Laut dalam "Genshin Impact". . Diilhamkan oleh undang-undang "survival of the fittest" Darwin, pengarang mencadangkan rangka kerja umum untuk ejen pintar berdasarkan model besar. Sekiranya seseorang itu ingin terus hidup dalam masyarakat, dia mesti belajar menyesuaikan diri dengan persekitaran, jadi dia perlu mempunyai kebolehan kognitif dan dapat melihat dan bertindak balas terhadap perubahan di dunia luar. Begitu juga, rangka kerja ejen pintar juga terdiri daripada tiga bahagian:

Terminal kawalan (Otak), terminal persepsi (Persepsi) dan terminal tindakan (Tindakan).

Kawalan : Biasanya terdiri daripada LLM, ia adalah teras ejen pintar. Ia bukan sahaja boleh menyimpan ingatan dan pengetahuan, tetapi juga menjalankan fungsi yang sangat diperlukan seperti pemprosesan maklumat dan membuat keputusan. Ia boleh membentangkan proses penaakulan dan perancangan, dan menangani tugas yang tidak diketahui dengan baik, mencerminkan generalisasi dan kebolehpindahan ejen pintar.

Tamat persepsi

: Meluaskan ruang persepsi ejen pintar daripada teks tulen untuk memasukkan medan berbilang modal seperti teks, penglihatan dan pendengaran, membolehkan ejen memperoleh dan menggunakan maklumat daripada persekitaran sekeliling dengan lebih berkesan.

Sisi mudah alih

: Sebagai tambahan kepada output teks biasa, ejen juga diberi keupayaan untuk menjelma dan menggunakan alatan, membolehkannya menyesuaikan diri dengan perubahan persekitaran dengan lebih baik, berinteraksi dengan persekitaran melalui maklum balas, dan juga membentuk persekitaran .

S Rangka kerja konsep EJEN BERASASKAN LLM mengandungi tiga komponen: terminal kawalan, persepsi dan penamat tindakan.
^{Pengarang menggunakan contoh untuk menggambarkan aliran kerja Ejen berasaskan LLM: apabila manusia bertanya sama ada hujan akan turun, penghujung persepsi (Persepsi) menukar arahan menjadi representasi yang boleh difahami oleh LLM. Kemudian terminal kawalan (Otak) memulakan penaakulan dan perancangan tindakan berdasarkan ramalan cuaca dan cuaca semasa di Internet. Akhirnya, Tindakan bertindak balas dan menyerahkan payung kepada manusia.}

Dengan mengulangi proses di atas, ejen pintar boleh terus mendapatkan maklum balas dan berinteraksi dengan persekitaran.

Control terminal: Brain

Sebagai komponen teras ejen pintar, pengarang memperkenalkan keupayaannya dari lima aspek:
interaksi bahasa
sebuah medium komunikasi yang mengandungi maklumat yang kaya. Terima kasih kepada penjanaan bahasa semula jadi yang berkuasa dan keupayaan pemahaman LLM, ejen pintar boleh berinteraksi dengan dunia luar untuk berbilang pusingan melalui bahasa semula jadi untuk mencapai matlamat mereka. Secara khusus, ia boleh dibahagikan kepada dua aspek:

Penjanaan teks berkualiti tinggi: Sebilangan besar eksperimen penilaian menunjukkan bahawa LLM boleh menghasilkan teks yang lancar, pelbagai, novel dan boleh dikawal. Walaupun prestasi lemah dalam bahasa individu, kemahiran berbilang bahasa yang baik secara keseluruhan tersedia.

Pemahaman tentang implikasi: Selain kandungan yang dinyatakan secara intuitif, bahasa juga boleh menyampaikan maklumat seperti niat dan pilihan penutur. Implikasinya ialah ia membantu ejen berkomunikasi dan bekerjasama dengan lebih cekap, dan model besar telah pun menunjukkan potensi dalam hal ini.
- Pengetahuan:
Walaupun LLM sendiri masih menghadapi masalah seperti luput pengetahuan dan halusinasi, beberapa penyelidikan sedia ada boleh diringankan pada tahap tertentu melalui kaedah seperti penyuntingan pengetahuan atau memanggil pangkalan pengetahuan luar.

Memori:
Dalam rangka artikel ini, modul memori (Memori) menyimpan urutan pemerhatian, pemikiran dan tindakan ejen yang lalu. Melalui mekanisme ingatan khusus, ejen boleh merenung dan menggunakan strategi sebelumnya dengan berkesan, membolehkan mereka menggunakan pengalaman lalu untuk menyesuaikan diri dengan persekitaran yang tidak dikenali.

Terdapat tiga kaedah yang biasanya digunakan untuk meningkatkan keupayaan ingatan:

Melanjutkan had panjang seni bina Backbone: menambah baik masalah had panjang jujukan sedia ada Transformers.

Ringkaskan: Meringkaskan ingatan untuk meningkatkan keupayaan ejen untuk mengekstrak butiran penting daripada ingatan.
- Memori termampat (Memampatkan): Dengan memampatkan memori menggunakan vektor atau struktur data yang sesuai, kecekapan mendapatkan semula ingatan boleh dipertingkatkan.
- Selain itu, kaedah cari semula ingatan juga sangat penting Hanya dengan mendapatkan semula kandungan yang sesuai boleh ejen mengakses maklumat yang paling relevan dan tepat.
Penaakulan & Perancangan:
Keupayaan penaakulan adalah penting untuk ejen pintar melaksanakan tugas yang rumit seperti membuat keputusan dan analisis. Khusus untuk LLM, ia adalah satu siri kaedah dorongan yang diwakili oleh Rantaian Pemikiran (CoT). Perancangan adalah strategi yang biasa digunakan apabila menghadapi cabaran besar. Ia membantu ejen mengatur pemikiran mereka, menetapkan matlamat dan mengenal pasti langkah untuk mencapai matlamat tersebut. Dalam pelaksanaan khusus, perancangan boleh merangkumi dua langkah:

Penggubalan Rancangan: Ejen membahagikan tugas yang kompleks kepada subtugas yang lebih terurus. Contohnya: penguraian satu kali dan kemudian pelaksanaan dalam urutan, perancangan dan pelaksanaan langkah demi langkah, perancangan berbilang laluan dan pemilihan laluan optimum, dsb. Dalam sesetengah senario yang memerlukan pengetahuan profesional, ejen boleh disepadukan dengan modul Perancang khusus domain untuk meningkatkan keupayaan.

Refleksi Rancangan: Selepas membuat perancangan, anda boleh merenung dan menilai kekuatan dan kelemahannya. Refleksi ini secara amnya datang dari tiga aspek: menggunakan mekanisme maklum balas dalaman mendapatkan maklum balas daripada berinteraksi dengan manusia dan mendapatkan maklum balas daripada persekitaran;
- Kebolehpindahan & Generalisasi:
Generalisasi kepada tugas yang tidak diketahui: Apabila saiz model dan data latihan meningkat, LLM muncul untuk menyelesaikan tugas yang tidak diketahui Mempunyai kebolehan yang menakjubkan .Model besar diperhalusi dengan arahan berprestasi baik dalam ujian sifar pukulan, mencapai keputusan yang sebaik model pakar dalam banyak tugas.
Pembelajaran Dalam Konteks: Model besar bukan sahaja dapat belajar melalui analogi daripada sebilangan kecil contoh dalam konteks, keupayaan ini juga boleh diperluaskan kepada adegan berbilang modal di luar teks, menyediakan aplikasi dunia sebenar untuk ejen Menyediakan lebih banyak kemungkinan.
Pembelajaran Berterusan: Cabaran utama pembelajaran berterusan ialah melupakan bencana, iaitu apabila model mempelajari tugasan baru, ia mudah kehilangan pengetahuan dalam tugasan lepas. Ejen pintar dalam domain khusus harus cuba mengelakkan kehilangan pengetahuan dalam domain umum.

Tamat persepsi: Persepsi

Manusia melihat dunia dalam pelbagai cara, jadi penyelidik mempunyai jangkaan yang sama untuk Ejen berasaskan LLM. Persepsi multimodal boleh memperdalam pemahaman ejen tentang persekitaran kerja dan meningkatkan fleksibilitinya dengan ketara.

Input teks: Sebagai keupayaan paling asas LLM, saya tidak akan menerangkan butiran di sini.

Input visual: LLM sendiri tidak mempunyai keupayaan persepsi visual dan hanya boleh memahami kandungan teks diskret. Dan input visual biasanya mengandungi banyak maklumat tentang dunia, termasuk sifat objek, hubungan ruang, susun atur pemandangan, dsb. Kaedah biasa ialah:

Tukar input visual kepada penerangan teks yang sepadan (Kapsyen Imej): ia boleh difahami secara langsung oleh LLM dan mempunyai kebolehtafsiran yang tinggi.
Pengekodan dan mewakili maklumat visual: Modul persepsi terdiri daripada model asas visual + paradigma LLM, dan model memahami kandungan modaliti yang berbeza melalui operasi penjajaran, yang boleh dilatih secara hujung ke hujung.

Input pendengaran: Pendengaran juga merupakan bahagian penting dalam persepsi manusia. Memandangkan LLM mempunyai keupayaan panggilan alat yang sangat baik, idea intuitif ialah ejen boleh menggunakan LLM sebagai hab kawalan, memanggil set alat sedia ada atau model pakar secara berlatarkan untuk melihat maklumat audio. Selain itu, audio juga boleh diwakili secara visual melalui spektrogram. Spektrogram boleh digunakan sebagai imej rata untuk memaparkan maklumat 2D, jadi beberapa kaedah pemprosesan visual boleh dipindahkan ke medan pertuturan.

Input Lain: Maklumat dalam dunia sebenar adalah lebih daripada teks, penglihatan dan pendengaran. Penulis berharap pada masa akan datang, ejen pintar akan dilengkapi dengan modul persepsi yang lebih kaya, seperti sentuhan, bau dan organ lain, untuk mendapatkan atribut objek sasaran yang lebih kaya. Pada masa yang sama, ejen juga boleh mempunyai rasa yang jelas tentang suhu, kelembapan dan cahaya persekitaran sekeliling dan mengambil lebih banyak tindakan yang mementingkan alam sekitar.

Selain itu, ejen juga boleh diperkenalkan kepada persepsi persekitaran keseluruhan yang lebih luas: menggunakan modul persepsi matang seperti lidar, GPS, dan unit ukuran inersia.

Action end: Action

Selepas otak membuat analisis dan membuat keputusan, ejen juga perlu mengambil tindakan untuk menyesuaikan diri atau mengubah persekitaran:

keluaran Memandangkan kebolehan Paling Asas LLM tidak akan diterangkan di sini.

Penggunaan alatan:

Walaupun LLM mempunyai rizab pengetahuan dan keupayaan profesional yang sangat baik, apabila berhadapan dengan masalah tertentu, beberapa siri cabaran seperti isu keteguhan dan halusinasi mungkin timbul. Pada masa yang sama, alatan, sebagai lanjutan daripada keupayaan pengguna, boleh memberikan bantuan dalam aspek seperti profesionalisme, fakta dan kebolehtafsiran. Contohnya, anda boleh menggunakan kalkulator untuk menyelesaikan masalah matematik dan enjin carian untuk mencari maklumat masa nyata.

Selain itu, alatan juga boleh meluaskan ruang tindakan ejen pintar. Sebagai contoh, tindakan berbilang modal boleh diperoleh dengan memanggil model pakar seperti penjanaan pertuturan dan penjanaan imej. Oleh itu, bagaimana untuk menjadikan ejen menjadi pengguna alat yang sangat baik, iaitu, mempelajari cara menggunakan alat dengan berkesan, adalah hala tuju yang sangat penting dan menjanjikan.

Pada masa ini, kaedah pembelajaran alat utama termasuk belajar daripada demonstrasi dan belajar daripada maklum balas. Di samping itu, meta-pembelajaran, pembelajaran kursus, dan lain-lain juga boleh digunakan untuk menyediakan agen dengan keupayaan generalisasi dalam menggunakan pelbagai alat. Melangkah lebih jauh, ejen pintar boleh mempelajari lebih lanjut cara membuat alat "berdikari", dengan itu meningkatkan autonomi dan kebebasan mereka. 🎜🎜🎜🎜Tindakan terwujud: 🎜Embodiment merujuk kepada keupayaan ejen untuk memahami, mengubah persekitaran dan mengemas kini keadaannya sendiri semasa interaksi dengan persekitaran. Tindakan Terwujud dianggap sebagai jambatan antara kecerdasan maya dan realiti fizikal.

Ejen berasaskan pembelajaran pengukuhan tradisional mempunyai had dalam kecekapan sampel, generalisasi dan penaakulan masalah yang kompleks, manakala Ejen berasaskan LLM memperkenalkan pengetahuan intrinsik yang kaya tentang model besar, membolehkan Ejen Terjelma berkelakuan seperti manusia Mengesan dan mempengaruhi persekitaran fizikal secara aktif . Bergantung pada tahap autonomi ejen dalam tugas atau kerumitan Tindakan, mungkin terdapat Tindakan atom berikut:

Pemerhatian boleh membantu ejen pintar mengesan kedudukannya sendiri dalam persekitaran, melihat objek dan item, dan mendapatkan maklumat persekitaran yang lain; kepada maklumat alam sekitar.
Dengan menggabungkan tindakan atom ini, ejen boleh menyelesaikan tugas yang lebih kompleks. Contohnya, tugasan QA yang terkandung seperti "Adakah tembikai di dapur lebih besar daripada mangkuk?" Untuk menyelesaikan masalah ini, ejen perlu menavigasi ke dapur dan mendapatkan jawapan selepas memerhatikan saiz kedua-duanya.

Terhad oleh kos perkakasan dunia fizikal yang tinggi dan kekurangan set data yang terkandung, penyelidikan semasa mengenai tindakan yang terkandung masih tertumpu terutamanya pada persekitaran kotak pasir maya seperti platform permainan "Minecraft". Oleh itu, di satu pihak, penulis mengharapkan paradigma tugasan dan standard penilaian yang lebih dekat dengan realiti Sebaliknya, mereka juga memerlukan lebih banyak penerokaan mengenai pembinaan set data yang relevan.

Agen dalam Amalan: Senario aplikasi yang pelbagai

Pada masa ini, Ejen berasaskan LLM telah menunjukkan kepelbagaian yang mengagumkan dan prestasi yang hebat. Contoh aplikasi biasa seperti AutoGPT, MetaGPT, CAMEL dan GPT Engineer berkembang pesat pada kadar yang tidak pernah berlaku sebelum ini.

Sebelum memperkenalkan aplikasi khusus, penulis membincangkan prinsip reka bentuk Ejen dalam Amalan:

1. Bantu pengguna membebaskan diri mereka daripada tugas harian dan kerja berulang, mengurangkan tekanan kerja manusia, dan meningkatkan kecekapan kerja. tugas;

2. Pengguna tidak perlu lagi mengeluarkan arahan tahap rendah yang jelas, dan boleh menganalisis, merancang dan menyelesaikan masalah sepenuhnya secara autonomi

3 sains Beri permainan sepenuhnya kepada potensi mereka dalam bidang dan menyelesaikan kerja-kerja inovatif dan penerokaan. Pada dasar ini, penggunaan ejen boleh mempunyai tiga paradigma:

Tiga paradigma permohonan ejen berasaskan LLM: ejen tunggal, multi-agen, dan interaksi manusia-komputer. . Penulis pertama kali menghuraikan senario aplikasinya yang pelbagai dan keupayaan yang sepadan dalam senario aplikasi ejen pintar tunggal.

Dalam artikel ini, penggunaan ejen pintar tunggal dibahagikan kepada tiga peringkat berikut:

Pasukan NLP Fudan mengeluarkan gambaran keseluruhan 80 halaman ejen model berskala besar, memberikan gambaran keseluruhan keadaan semasa dan masa depan ejen AI dalam satu artikel 的 Tiga peringkat senario aplikasi proksi tunggal: berorientasikan tugas, orientasi inovatif dan orientasi kitaran hayat.

Dalam penggunaan

, ejen membantu pengguna manusia mengendalikan tugas harian asas. Mereka perlu mempunyai pemahaman arahan asas, penguraian tugas, dan keupayaan untuk berinteraksi dengan persekitaran. Secara khusus, mengikut jenis tugas sedia ada, aplikasi sebenar ejen boleh dibahagikan kepada persekitaran rangkaian simulasi dan senario kehidupan simulasi.
Dalam penggunaan
, ejen boleh menunjukkan potensi untuk siasatan bebas dalam bidang saintifik yang canggih. Walaupun kerumitan yang wujud dan kekurangan data latihan dari bidang khusus menghalang pembinaan ejen pintar, sudah ada banyak kerja yang membuat kemajuan dalam bidang seperti kimia, bahan, komputer, dll.
Dalam
, ejen mempunyai keupayaan untuk terus meneroka, mempelajari dan menggunakan kemahiran baharu dalam dunia terbuka, dan bertahan untuk jangka masa yang lama. Dalam bahagian ini, penulis mengambil permainan "Minecraft" sebagai contoh. Memandangkan cabaran kelangsungan hidup dalam permainan boleh dianggap sebagai mikrokosmos dunia sebenar, ramai penyelidik telah menggunakannya sebagai platform unik untuk membangun dan menguji keupayaan komprehensif ejen.

Senario Berbilang Ejen

Pada tahun 1986, Marvin Minsky membuat ramalan yang berpandangan ke hadapan. Dalam The Society of Mind, beliau mencadangkan teori baru tentang kecerdasan, dengan alasan bahawa kecerdasan timbul daripada interaksi banyak agen yang lebih kecil dan khusus fungsi. Sebagai contoh, sesetengah ejen mungkin bertanggungjawab untuk mengenal pasti corak, manakala yang lain mungkin bertanggungjawab untuk membuat keputusan atau menjana penyelesaian.

Idea ini telah dilaksanakan secara konkrit dengan peningkatan kecerdasan buatan teragih. Sistem Multi-Agen, sebagai salah satu isu penyelidikan utama, tertumpu terutamanya pada cara ejen boleh menyelaras dan bekerjasama dengan berkesan untuk menyelesaikan masalah. Pengarang artikel ini membahagikan interaksi antara berbilang ejen kepada dua bentuk berikut: dua bentuk interaksi

Pasukan NLP Fudan mengeluarkan gambaran keseluruhan 80 halaman ejen model berskala besar, memberikan gambaran keseluruhan keadaan semasa dan masa depan ejen AI dalam satu artikel

senario aplikasi berbilang ejen: interaksi koperasi dan interaksi konfrontasi. . Secara khusus, mengikut bentuk kerjasama yang berbeza, penulis membahagikan interaksi koperasi kepada kerjasama yang tidak teratur dan kerjasama yang teratur.

Apabila semua ejen bebas menyuarakan pandangan dan pendapat dan bekerjasama secara tidak berurutan, ia dipanggil kerjasama tidak teratur.

Apabila semua ejen mengikut peraturan tertentu seperti menyatakan pendapat mereka satu persatu dalam bentuk barisan perhimpunan, keseluruhan proses kerjasama adalah teratur, yang dinamakan kerjasama tertib.

Interaksi musuh:

Senario interaksi manusia-komputer

Interaksi Manusia-Ejen, seperti namanya, adalah ejen pintar yang bekerjasama dengan manusia untuk menyelesaikan tugas. Di satu pihak, keupayaan pembelajaran dinamik ejen perlu disokong oleh komunikasi sebaliknya, prestasi sistem ejen semasa dalam kebolehtafsiran masih tidak mencukupi, dan mungkin terdapat masalah dalam keselamatan, kesahihan, dan lain-lain, jadi ia memerlukan manusia; penyertaan.

Pengarang membahagikan interaksi Manusia-Agen kepada dua mod berikut dalam kertas:

的 Dua mod adegan interaksi manusia-mesin: Mod Pengajar-PELAKSANA lwn mod PERKONGSIAN Sama.

: Manusia bertindak sebagai pengajar, memberi arahan dan maklum balas, ejen bertindak sebagai pelaksana, secara beransur-ansur menyesuaikan dan mengoptimumkan mengikut arahan. Model ini telah digunakan secara meluas dalam bidang pendidikan, perubatan, perniagaan dan lain-lain.
Sesetengah kajian mendapati bahawa ejen boleh menunjukkan empati dalam komunikasi dengan manusia, atau mengambil bahagian dalam pelaksanaan tugas secara sama rata. Agen pintar menunjukkan potensi untuk diaplikasikan dalam kehidupan seharian dan diharapkan dapat diintegrasikan ke dalam masyarakat manusia pada masa hadapan.

Masyarakat Ejen: Dari personaliti kepada sosialiti

Sejak sekian lama, penyelidik mengimpikan untuk membina "masyarakat buatan interaktif", daripada permainan kotak pasir "Meta Sims" "Universe", definisi masyarakat simulasi boleh diringkaskan sebagai: persekitaran + individu yang hidup dan berinteraksi dalam persekitaran.

Dalam artikel tersebut, penulis menggunakan gambar rajah untuk menerangkan kerangka konseptual masyarakat Agen:

念 Rangka kerja konsep masyarakat agensi dibahagikan kepada dua bahagian utama: agensi dan persekitaran.

Dalam rangka kerja ini, kita boleh lihat:

Di peringkat individu, ejen yang dicerminkan mempamerkan alasan yang jelas. . Selain itu, ejen mempamerkan ciri personaliti intrinsik yang merangkumi dimensi kognitif, emosi dan personaliti.
Ejen tunggal boleh membentuk kumpulan dengan ejen individu lain untuk bersama-sama mempamerkan tingkah laku kumpulan seperti kerjasama, seperti kerjasama kolaboratif.
Persekitaran boleh dalam bentuk persekitaran kotak pasir maya atau dunia fizikal sebenar. Elemen alam sekitar merangkumi aktor manusia dan pelbagai sumber yang ada. Untuk ejen tunggal, ejen lain juga merupakan sebahagian daripada persekitaran.
Ejen mengambil bahagian secara aktif dalam keseluruhan proses interaksi dengan merasakan persekitaran luaran dan mengambil tindakan.

Tingkah laku sosial dan keperibadian ejen

Artikel mengkaji prestasi ejen dalam masyarakat dari perspektif tingkah laku luaran dan personaliti dalaman

Tingkah laku sosial :

Dari perspektif sosial, tingkah laku boleh dibahagikan kepada dua peringkat: individu dan kolektif:

Tingkah laku individu membentuk asas untuk operasi dan perkembangan ejen itu sendiri. Ia termasuk input yang diwakili oleh persepsi, output yang diwakili oleh tindakan, dan tingkah laku dalaman ejen itu sendiri.

Termasuk kognisi, emosi dan personaliti. Sama seperti manusia secara beransur-ansur mengembangkan sifat mereka melalui proses sosialisasi, agen juga mempamerkan apa yang dipanggil "kecerdasan seperti manusia", yang merupakan pembentukan beransur-ansur personaliti melalui interaksi dengan kumpulan dan persekitaran.

Kebolehan kognitif: Merangkumi proses di mana ejen memperoleh dan memahami pengetahuan Penyelidikan menunjukkan bahawa ejen berasaskan LLM boleh mempamerkan pertimbangan dan kecerdasan yang serupa dengan manusia dalam beberapa aspek.

Masyarakat ejen bukan sahaja terdiri daripada individu yang berdikari, tetapi juga merangkumi persekitaran di mana mereka berinteraksi. Persekitaran mempengaruhi cara ejen melihat, bertindak, dan berinteraksi. Seterusnya, ejen juga mengubah keadaan persekitaran melalui tindakan dan keputusan mereka. Bagi ejen individu, persekitaran termasuk ejen autonomi lain, manusia dan sumber yang ada.

Di sini, pengarang meneroka tiga jenis persekitaran:

Persekitaran berasaskan teks:

Memandangkan LLM bergantung terutamanya pada bahasa kerana format input dan output mereka adalah kebanyakannya berasaskan teks untuk persekitaran semula jadi. platform operasi. Fenomena dan interaksi sosial diterangkan melalui kata-kata, dan persekitaran teks menyediakan pengetahuan semantik dan latar belakang. Ejen wujud dalam dunia teks dan bergantung pada sumber teks untuk memahami, menaakul dan bertindak.

Persekitaran Kotak Pasir Maya:

Dalam medan komputer, kotak pasir merujuk kepada persekitaran terkawal dan terpencil, sering digunakan untuk ujian perisian dan analisis virus. Persekitaran kotak pasir maya masyarakat ejen ialah platform untuk mensimulasikan interaksi sosial dan simulasi tingkah laku Ciri-ciri utamanya termasuk:

Visualisasi: Anda boleh menggunakan antara muka grafik 2D yang ringkas atau pemodelan 3D yang kompleks untuk memaparkan dunia , menggambarkan semua aspek masyarakat simulasi dengan cara yang intuitif.

Persekitaran fizikal ialah persekitaran ketara yang terdiri daripada objek dan ruang sebenar di mana ejen memerhati dan bertindak. Persekitaran ini memperkenalkan input deria yang kaya (visual, pendengaran dan ruang). Tidak seperti persekitaran maya, ruang fizikal meletakkan lebih banyak permintaan pada tingkah laku ejen. Iaitu, ejen mesti boleh menyesuaikan diri dalam persekitaran fizikal dan menjana kawalan gerakan boleh laku.

Pengarang memberi contoh untuk menerangkan kerumitan persekitaran fizikal: bayangkan agen pintar mengendalikan lengan robot di kilang Apabila mengendalikan lengan robot, kawalan daya yang tepat diperlukan untuk mengelakkan objek daripada bahan yang berbeza ; sebagai tambahan, ejen Ia adalah perlu untuk menavigasi dalam ruang kerja fizikal dan menyesuaikan laluan pergerakan dalam masa untuk mengelakkan halangan dan mengoptimumkan trajektori pergerakan lengan robot.

Keperluan ini meningkatkan kerumitan dan cabaran ejen dalam persekitaran fizikal.

Simulasi, mulakan!

Dalam artikel itu, penulis percaya bahawa masyarakat yang disimulasikan harus terbuka, gigih, mengikut situasi dan teratur. Keterbukaan membolehkan ejen memasuki dan meninggalkan masyarakat yang disimulasikan secara autonomi bermakna masyarakat mempunyai trajektori yang koheren yang berkembang dari semasa ke semasa menekankan kewujudan dan operasi subjek dalam persekitaran tertentu memastikan masyarakat yang disimulasikan mempunyai dunia fizikal; seperti peraturan dan sekatan.

Mengenai kepentingan masyarakat simulasi, bandar Ejen Generatif di Universiti Stanford memberikan contoh yang jelas untuk semua orang - Masyarakat ejen boleh digunakan untuk meneroka sempadan keupayaan perisikan kumpulan, contohnya, ejen secara bersama menganjurkan pesta Hari Valentine ; Ia juga boleh digunakan untuk mempercepatkan penyelidikan sains sosial, seperti memerhati fenomena komunikasi dengan mensimulasikan rangkaian sosial. Di samping itu, terdapat juga kajian untuk meneroka nilai di sebalik ejen dengan mensimulasikan senario membuat keputusan beretika, dan untuk membantu membuat keputusan dengan mensimulasikan kesan dasar terhadap masyarakat.

Selanjutnya, pengarang menunjukkan bahawa simulasi ini juga mungkin mempunyai risiko tertentu, termasuk tetapi tidak terhad kepada: stereotaip dan prasangka yang berlebihan; Soalan-soalan terbuka yang berpandangan jauh dari akhir kertas, penulis juga membincangkan beberapa soalan terbuka yang berpandangan ke hadapan untuk memberi inspirasi kepada pembaca untuk memikirkan: ejen dan model bahasa besar Bagaimanakah penyelidikan kita boleh mempromosikan satu sama lain dan berkembang bersama?

Model besar telah menunjukkan potensi yang kuat dalam pemahaman bahasa, membuat keputusan dan keupayaan generalisasi, dan telah menjadi peranan utama dalam proses pembinaan ejen juga telah mengemukakan keperluan yang lebih tinggi untuk model besar.

Apakah cabaran dan kebimbangan yang akan dibawa oleh Ejen berasaskan LLM?

Sama ada ejen pintar benar-benar boleh diamalkan memerlukan penilaian keselamatan yang rapi untuk mengelakkan bahaya kepada dunia sebenar. Penulis merumuskan lebih banyak ancaman yang berpotensi, seperti: penyalahgunaan haram, risiko pengangguran, kesan terhadap kesejahteraan manusia, dsb.

Apakah peluang dan cabaran yang akan dibawa oleh peningkatan?

Dalam masyarakat simulasi, menambah bilangan individu boleh meningkatkan kredibiliti dan ketulenan simulasi dengan ketara. Walau bagaimanapun, apabila bilangan ejen meningkat, masalah komunikasi dan penyebaran mesej akan menjadi agak rumit, dan herotan maklumat, salah faham atau halusinasi akan mengurangkan kecekapan keseluruhan sistem simulasi dengan ketara.

Perdebatan di Internet tentang sama ada Agen berasaskan LLM adalah laluan yang sesuai untuk AGI.
Sesetengah penyelidik percaya bahawa model besar yang diwakili oleh GPT-4 telah dilatih dengan korpus yang mencukupi, dan ejen yang dibina atas dasar ini berpotensi menjadi kunci untuk membuka pintu kepada AGI. Tetapi penyelidik lain percaya bahawa pemodelan bahasa auto-regresif tidak menunjukkan kecerdasan sebenar kerana mereka hanya bertindak balas. Kaedah pemodelan yang lebih lengkap, seperti Model Dunia, boleh membawa kepada AGI.

Evolusi kecerdasan swarm. Perisikan khalayak ialah satu proses mengumpul pendapat ramai orang dan mengubahnya menjadi keputusan.
Namun, adakah "kepintaran" sebenar akan dihasilkan dengan hanya menambah bilangan ejen? Di samping itu, bagaimana untuk menyelaraskan ejen individu untuk membolehkan masyarakat ejen pintar mengatasi "groupthink" dan kecenderungan kognitif peribadi?

Ejen sebagai Perkhidmatan (AaaS). Memandangkan Ejen berasaskan LLM adalah lebih kompleks daripada model besar itu sendiri, dan lebih sukar untuk perusahaan atau individu bersaiz kecil dan sederhana untuk membina secara tempatan, vendor awan boleh mempertimbangkan untuk melaksanakan ejen pintar dalam bentuk perkhidmatan, iaitu, Agen- sebagai-Perkhidmatan. Seperti perkhidmatan awan lain, AaaS berpotensi untuk menyediakan pengguna dengan fleksibiliti tinggi dan layan diri atas permintaan.

Atas ialah kandungan terperinci Pasukan NLP Fudan mengeluarkan gambaran keseluruhan 80 halaman ejen model berskala besar, memberikan gambaran keseluruhan keadaan semasa dan masa depan ejen AI dalam satu artikel. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan

Artikel ini dikembalikan pada:机器之心. Jika ada pelanggaran, sila hubungi admin@php.cn Padam

Artikel Berkaitan

Anda mesti membina tempat kerja ai di belakang tudung kejahilanApr 29, 2025 am 11:15 AM

Dalam buku seminal John Rawls pada tahun 1971 The Theory of Justice, beliau mencadangkan percubaan pemikiran yang harus kita ambil sebagai inti reka bentuk AI hari ini dan menggunakan keputusan: tudung kejahilan. Falsafah ini menyediakan alat yang mudah untuk memahami ekuiti dan juga menyediakan pelan tindakan untuk pemimpin untuk menggunakan pemahaman ini untuk mereka bentuk dan melaksanakan AI dengan cara yang saksama. Bayangkan anda membuat peraturan untuk masyarakat baru. Tetapi ada premis: anda tidak tahu terlebih dahulu apa peranan yang akan anda mainkan dalam masyarakat ini. Anda mungkin menjadi kaya atau miskin, sihat atau kurang upaya, milik majoriti atau minoriti marginal. Beroperasi di bawah "VEIL OF KETIGA" ini menghalang pembuat peraturan daripada membuat keputusan yang memberi manfaat kepada diri mereka sendiri. Sebaliknya, orang akan lebih bermotivasi untuk merumuskan orang ramai

Keputusan, Keputusan ... Langkah seterusnya untuk Praktikal Gunaan AIApr 29, 2025 am 11:14 AM

Banyak syarikat yang mengkhususkan diri dalam Automasi Proses Robot (RPA), menawarkan bot untuk mengautomasikan tugas berulang -UIPATH, Automasi di mana sahaja, Prism Blue, dan lain -lain. Sementara itu, proses perlombongan, orkestrasi, dan pemprosesan dokumen pintar Special

Ejen akan datang - lebih banyak mengenai apa yang akan kita lakukan di sebelah rakan kongsi AIApr 29, 2025 am 11:13 AM

Masa depan AI bergerak melampaui ramalan kata mudah dan simulasi perbualan; Ejen AI muncul, mampu tindakan bebas dan penyelesaian tugas. Peralihan ini sudah jelas dalam alat seperti Claude Anthropic. Ejen AI: Penyelidikan a

Mengapa empati lebih penting daripada mengawal pemimpin dalam masa depan yang didorong oleh AIApr 29, 2025 am 11:12 AM

Kemajuan teknologi yang pesat memerlukan perspektif yang berpandangan ke hadapan pada masa depan kerja. Apa yang berlaku apabila AI melampaui peningkatan produktiviti semata -mata dan mula membentuk struktur masyarakat kita? Buku yang akan datang Topher McDougal, Gaia Wakes:

AI untuk Klasifikasi Produk: Bolehkah Mesin Undang -undang Cukai Master?Apr 29, 2025 am 11:11 AM

Klasifikasi produk, sering melibatkan kod kompleks seperti "HS 8471.30" dari sistem seperti sistem harmoni (HS), adalah penting untuk perdagangan antarabangsa dan jualan domestik. Kod ini memastikan permohonan cukai yang betul, memberi kesan kepada setiap inv

Bolehkah Pusat Data menuntut mencetuskan pemulihan teknologi iklim?Apr 29, 2025 am 11:10 AM

Masa Depan Penggunaan Tenaga di Pusat Data dan Pelaburan Teknologi Iklim Artikel ini menerangkan lonjakan penggunaan tenaga di pusat data yang didorong oleh AI dan kesannya terhadap perubahan iklim, dan menganalisis penyelesaian inovatif dan cadangan dasar untuk menangani cabaran ini. Cabaran Permintaan Tenaga: Pusat data besar-besaran dan ultra-besar menggunakan kuasa besar, setanding dengan jumlah beratus-ratus ribu keluarga Amerika Utara yang biasa, dan pusat-pusat skala ultra-besar AI yang muncul menggunakan puluhan kali lebih banyak kuasa daripada ini. Dalam lapan bulan pertama 2024, Microsoft, Meta, Google dan Amazon telah melabur kira -kira AS $ 125 bilion dalam pembinaan dan operasi pusat data AI (JP Morgan, 2024) (Jadual 1). Permintaan tenaga yang semakin meningkat adalah satu cabaran dan peluang. Menurut Canary Media, elektrik yang menjulang

Ai dan Hollywood's Next Golden AgeApr 29, 2025 am 11:09 AM

AI Generatif merevolusi pengeluaran filem dan televisyen. Model Ray 2 Luma, serta Runway's Gen-4, Openai's Sora, Veo Google dan model-model baru yang lain, meningkatkan kualiti video yang dihasilkan pada kelajuan yang belum pernah terjadi sebelumnya. Model-model ini dengan mudah boleh mewujudkan kesan khas yang kompleks dan adegan yang realistik, walaupun klip video pendek dan kesan gerakan yang diperolehi oleh kamera telah dicapai. Walaupun manipulasi dan konsistensi alat -alat ini masih perlu diperbaiki, kelajuan kemajuan adalah menakjubkan. Video generatif menjadi medium bebas. Sesetengah model baik pada pengeluaran animasi, sementara yang lain baik pada imej aksi langsung. Perlu diingat bahawa Firefly Adobe dan Moonvalley's Ma

Adakah Chatgpt perlahan-lahan menjadi Yes-Man terbesar AI?Apr 29, 2025 am 11:08 AM

Pengalaman Pengguna CHATGPT Menolak: Adakah Degradasi Model atau Harapan Pengguna? Baru -baru ini, sebilangan besar pengguna berbayar ChatGPT telah mengadu tentang kemerosotan prestasi mereka, yang telah menarik perhatian yang meluas. Pengguna melaporkan tindak balas yang lebih perlahan terhadap model, jawapan yang lebih pendek, kekurangan bantuan, dan lebih banyak halusinasi. Sesetengah pengguna menyatakan rasa tidak puas hati di media sosial, menunjukkan bahawa ChatGPT telah menjadi "terlalu menyanjung" dan cenderung untuk mengesahkan pandangan pengguna dan bukannya memberikan maklum balas kritikal. Ini bukan sahaja memberi kesan kepada pengalaman pengguna, tetapi juga membawa kerugian sebenar kepada pelanggan korporat, seperti mengurangkan produktiviti dan pembaziran sumber pengkomputeran. Bukti kemerosotan prestasi Ramai pengguna telah melaporkan kemerosotan yang ketara dalam prestasi CHATGPT, terutamanya dalam model yang lebih lama seperti GPT-4 (yang tidak lama lagi akan dihentikan dari perkhidmatan pada akhir bulan ini). ini

See all articles

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Tunjukkan Lagi

Artikel Panas

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

3 minggu yang laluByDDD

Bagaimana untuk memperbaiki KB5055523 gagal dipasang di Windows 11?

2 minggu yang laluByDDD

Inzoi: Cara Memohon ke Sekolah dan Universiti

4 minggu yang laluByDDD

Bagaimana untuk memperbaiki KB5055518 gagal dipasang di Windows 10?

2 minggu yang laluByDDD

Roblox: Rails Dead - Cara Memanggil dan Mengalahkan Nikola Tesla

4 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Penyesuai Pelayan SAP NetWeaver untuk Eclipse

Integrasikan Eclipse dengan pelayan aplikasi SAP NetWeaver.

Muat turun versi mac editor Atom

Editor sumber terbuka yang paling popular

SecLists

SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.