Rumah >Peranti teknologi >AI >Pasukan NLP Fudan mengeluarkan gambaran keseluruhan 80 halaman ejen model berskala besar, memberikan gambaran keseluruhan keadaan semasa dan masa depan ejen AI dalam satu artikel

Pasukan NLP Fudan mengeluarkan gambaran keseluruhan 80 halaman ejen model berskala besar, memberikan gambaran keseluruhan keadaan semasa dan masa depan ejen AI dalam satu artikel

WBOY
WBOYke hadapan
2023-09-23 09:01:011335semak imbas
Baru-baru ini, Pasukan Pemprosesan Bahasa Semulajadi Universiti Fudan (FudanNLP) melancarkan kertas semakan mengenai Agen berasaskan LLM Teks penuh sepanjang 86 halaman dan mempunyai lebih daripada 600 rujukan! Bermula daripada sejarah Ejen AI, pengarang menyusun secara menyeluruh status ejen pintar semasa berdasarkan model bahasa yang besar, termasuk: latar belakang, komposisi, senario aplikasi Ejen berasaskan LLM dan masyarakat ejen yang banyak dibincangkan. Pada masa yang sama, penulis membincangkan isu-isu prospektif dan terbuka yang berkaitan dengan Ejen, yang sangat bernilai untuk trend pembangunan masa depan dalam bidang berkaitan.

Pasukan NLP Fudan mengeluarkan gambaran keseluruhan 80 halaman ejen model berskala besar, memberikan gambaran keseluruhan keadaan semasa dan masa depan ejen AI dalam satu artikel

    Pautan kertas: https://arxiv.org/pdf/2309.07864.pdf
  • Senarai kertas Agen berasaskan LLM: https://github.com/WooooDyy/LLM-Agenty-LLM-Agenty Ahli pasukan senarai

juga akan menambah "ringkasan satu ayat" untuk setiap kertas yang berkaitan, selamat datang ke gudang Star.

Latar belakang penyelidikan

Sejak sekian lama, penyelidik telah mengejar
kecerdasan buatan
umum (Kecerdasan Am Buatan, AGI) yang setara atau setara. Seawal tahun 1950-an, Alan Turing meluaskan konsep "kepintaran" kepada entiti tiruan dan mencadangkan ujian Turing yang terkenal. Entiti kecerdasan buatan ini sering dipanggil ejen (Agen*). Konsep "agen" berasal dari falsafah dan menggambarkan entiti yang mempunyai keinginan, kepercayaan, niat, dan keupayaan untuk mengambil tindakan. Dalam bidang kecerdasan buatan, istilah ini telah diberi makna baharu: Sebuah entiti pintar dengan ciri-ciri autonomi, kereaktifan, positif dan kebolehmasyarakatan.

* Tiada kata sepakat mengenai terjemahan bahasa Cina bagi istilah Ejen Sesetengah sarjana menterjemahkannya sebagai ejen, pelakon, ejen atau ejen pintar "ejen" dan "ejen pintar" yang kedua-duanya merujuk kepada Ejen.

Sejak itu, reka bentuk ejen telah menjadi tumpuan komuniti kecerdasan buatan. Walau bagaimanapun, kerja lepas terutamanya tertumpu pada meningkatkan kebolehan khusus ejen, seperti penaakulan simbolik atau penguasaan tugas tertentu (catur, Pergi, dll.). Kajian-kajian ini lebih menumpukan pada reka bentuk algoritma dan strategi latihan, sambil mengabaikan pembangunan keupayaan am yang wujud bagi model, seperti ingatan pengetahuan, perancangan jangka panjang, generalisasi yang berkesan dan interaksi yang cekap. Ternyata
meningkatkan keupayaan sedia ada model adalah faktor utama dalam menggalakkan perkembangan selanjutnya ejen pintar.

Kemunculan model bahasa besar (LLM) membawa harapan untuk perkembangan selanjutnya ejen pintar. Jika laluan pembangunan dari NLP ke AGI dibahagikan kepada lima peringkat: korpus, Internet, persepsi, penjelmaan, dan atribut sosial, maka model bahasa berskala besar semasa telah mencapai tahap kedua, dengan input dan output teks berskala Internet. Atas dasar ini, jika Agen berasaskan LLM diberi ruang persepsi dan ruang tindakan, mereka akan mencapai tahap ketiga dan keempat. Tambahan pula, apabila pelbagai ejen berinteraksi dan bekerjasama untuk menyelesaikan tugas yang lebih kompleks, atau mencerminkan tingkah laku sosial dalam dunia sebenar, mereka berpotensi untuk mencapai tahap kelima - masyarakat ejen.

一 Imaginasi pengarang tentang masyarakat harmoni yang terdiri daripada agen pintar juga boleh menyertainya. Adegan ini diambil dari Festival Tanglung Laut dalam "Genshin Impact". . Diilhamkan oleh undang-undang "survival of the fittest" Darwin, pengarang mencadangkan rangka kerja umum untuk ejen pintar berdasarkan model besar. Sekiranya seseorang itu ingin terus hidup dalam masyarakat, dia mesti belajar menyesuaikan diri dengan persekitaran, jadi dia perlu mempunyai kebolehan kognitif dan dapat melihat dan bertindak balas terhadap perubahan di dunia luar. Begitu juga, rangka kerja ejen pintar juga terdiri daripada tiga bahagian:

Terminal kawalan (Otak), terminal persepsi (Persepsi) dan terminal tindakan (Tindakan).

Kawalan : Biasanya terdiri daripada LLM, ia adalah teras ejen pintar. Ia bukan sahaja boleh menyimpan ingatan dan pengetahuan, tetapi juga menjalankan fungsi yang sangat diperlukan seperti pemprosesan maklumat dan membuat keputusan. Ia boleh membentangkan proses penaakulan dan perancangan, dan menangani tugas yang tidak diketahui dengan baik, mencerminkan generalisasi dan kebolehpindahan ejen pintar.

Tamat persepsi
: Meluaskan ruang persepsi ejen pintar daripada teks tulen untuk memasukkan medan berbilang modal seperti teks, penglihatan dan pendengaran, membolehkan ejen memperoleh dan menggunakan maklumat daripada persekitaran sekeliling dengan lebih berkesan.

Sisi mudah alih
: Sebagai tambahan kepada output teks biasa, ejen juga diberi keupayaan untuk menjelma dan menggunakan alatan, membolehkannya menyesuaikan diri dengan perubahan persekitaran dengan lebih baik, berinteraksi dengan persekitaran melalui maklum balas, dan juga membentuk persekitaran .

  • S Rangka kerja konsep EJEN BERASASKAN LLM mengandungi tiga komponen: terminal kawalan, persepsi dan penamat tindakan.
    Pengarang menggunakan contoh untuk menggambarkan aliran kerja Ejen berasaskan LLM: apabila manusia bertanya sama ada hujan akan turun, penghujung persepsi (Persepsi) menukar arahan menjadi representasi yang boleh difahami oleh LLM. Kemudian terminal kawalan (Otak) memulakan penaakulan dan perancangan tindakan berdasarkan ramalan cuaca dan cuaca semasa di Internet. Akhirnya, Tindakan bertindak balas dan menyerahkan payung kepada manusia.

    Dengan mengulangi proses di atas, ejen pintar boleh terus mendapatkan maklum balas dan berinteraksi dengan persekitaran.

    Control terminal: Brain

    Sebagai komponen teras ejen pintar, pengarang memperkenalkan keupayaannya dari lima aspek:
    interaksi bahasa
    sebuah medium komunikasi yang mengandungi maklumat yang kaya. Terima kasih kepada penjanaan bahasa semula jadi yang berkuasa dan keupayaan pemahaman LLM, ejen pintar boleh berinteraksi dengan dunia luar untuk berbilang pusingan melalui bahasa semula jadi untuk mencapai matlamat mereka. Secara khusus, ia boleh dibahagikan kepada dua aspek:

    Penjanaan teks berkualiti tinggi: Sebilangan besar eksperimen penilaian menunjukkan bahawa LLM boleh menghasilkan teks yang lancar, pelbagai, novel dan boleh dikawal. Walaupun prestasi lemah dalam bahasa individu, kemahiran berbilang bahasa yang baik secara keseluruhan tersedia.

    Pemahaman tentang implikasi: Selain kandungan yang dinyatakan secara intuitif, bahasa juga boleh menyampaikan maklumat seperti niat dan pilihan penutur. Implikasinya ialah ia membantu ejen berkomunikasi dan bekerjasama dengan lebih cekap, dan model besar telah pun menunjukkan potensi dalam hal ini.
    • Pengetahuan:
    • LLM yang dilatih berdasarkan kumpulan besar korpus mempunyai keupayaan untuk menyimpan sejumlah besar pengetahuan. Selain pengetahuan bahasa, pengetahuan akal dan pengetahuan kemahiran profesional adalah komponen penting Agen berasaskan LLM.

    Walaupun LLM sendiri masih menghadapi masalah seperti luput pengetahuan dan halusinasi, beberapa penyelidikan sedia ada boleh diringankan pada tahap tertentu melalui kaedah seperti penyuntingan pengetahuan atau memanggil pangkalan pengetahuan luar.

    Memori:
    Dalam rangka artikel ini, modul memori (Memori) menyimpan urutan pemerhatian, pemikiran dan tindakan ejen yang lalu. Melalui mekanisme ingatan khusus, ejen boleh merenung dan menggunakan strategi sebelumnya dengan berkesan, membolehkan mereka menggunakan pengalaman lalu untuk menyesuaikan diri dengan persekitaran yang tidak dikenali.

    Terdapat tiga kaedah yang biasanya digunakan untuk meningkatkan keupayaan ingatan:

    Melanjutkan had panjang seni bina Backbone: menambah baik masalah had panjang jujukan sedia ada Transformers.

    Ringkaskan: Meringkaskan ingatan untuk meningkatkan keupayaan ejen untuk mengekstrak butiran penting daripada ingatan.
    • Memori termampat (Memampatkan): Dengan memampatkan memori menggunakan vektor atau struktur data yang sesuai, kecekapan mendapatkan semula ingatan boleh dipertingkatkan.
    • Selain itu, kaedah cari semula ingatan juga sangat penting Hanya dengan mendapatkan semula kandungan yang sesuai boleh ejen mengakses maklumat yang paling relevan dan tepat.

    Penaakulan & Perancangan:
    Keupayaan penaakulan adalah penting untuk ejen pintar melaksanakan tugas yang rumit seperti membuat keputusan dan analisis. Khusus untuk LLM, ia adalah satu siri kaedah dorongan yang diwakili oleh Rantaian Pemikiran (CoT). Perancangan adalah strategi yang biasa digunakan apabila menghadapi cabaran besar. Ia membantu ejen mengatur pemikiran mereka, menetapkan matlamat dan mengenal pasti langkah untuk mencapai matlamat tersebut. Dalam pelaksanaan khusus, perancangan boleh merangkumi dua langkah:

    Penggubalan Rancangan: Ejen membahagikan tugas yang kompleks kepada subtugas yang lebih terurus. Contohnya: penguraian satu kali dan kemudian pelaksanaan dalam urutan, perancangan dan pelaksanaan langkah demi langkah, perancangan berbilang laluan dan pemilihan laluan optimum, dsb. Dalam sesetengah senario yang memerlukan pengetahuan profesional, ejen boleh disepadukan dengan modul Perancang khusus domain untuk meningkatkan keupayaan.

    Refleksi Rancangan: Selepas membuat perancangan, anda boleh merenung dan menilai kekuatan dan kelemahannya. Refleksi ini secara amnya datang dari tiga aspek: menggunakan mekanisme maklum balas dalaman mendapatkan maklum balas daripada berinteraksi dengan manusia dan mendapatkan maklum balas daripada persekitaran;
    • Kebolehpindahan & Generalisasi:
    • LLM dengan pengetahuan dunia memberikan agen pintar dengan keupayaan penghijrahan dan generalisasi yang berkuasa. Ejen yang baik bukanlah asas pengetahuan yang statik, tetapi juga harus mempunyai keupayaan pembelajaran dinamik:

    Generalisasi kepada tugas yang tidak diketahui: Apabila saiz model dan data latihan meningkat, LLM muncul untuk menyelesaikan tugas yang tidak diketahui Mempunyai kebolehan yang menakjubkan .Model besar diperhalusi dengan arahan berprestasi baik dalam ujian sifar pukulan, mencapai keputusan yang sebaik model pakar dalam banyak tugas.
  • Pembelajaran Dalam Konteks: Model besar bukan sahaja dapat belajar melalui analogi daripada sebilangan kecil contoh dalam konteks, keupayaan ini juga boleh diperluaskan kepada adegan berbilang modal di luar teks, menyediakan aplikasi dunia sebenar untuk ejen Menyediakan lebih banyak kemungkinan.
  • Pembelajaran Berterusan: Cabaran utama pembelajaran berterusan ialah melupakan bencana, iaitu apabila model mempelajari tugasan baru, ia mudah kehilangan pengetahuan dalam tugasan lepas. Ejen pintar dalam domain khusus harus cuba mengelakkan kehilangan pengetahuan dalam domain umum.

Tamat persepsi: Persepsi

Manusia melihat dunia dalam pelbagai cara, jadi penyelidik mempunyai jangkaan yang sama untuk Ejen berasaskan LLM. Persepsi multimodal boleh memperdalam pemahaman ejen tentang persekitaran kerja dan meningkatkan fleksibilitinya dengan ketara.

Input teks: Sebagai keupayaan paling asas LLM, saya tidak akan menerangkan butiran di sini.

Input visual: LLM sendiri tidak mempunyai keupayaan persepsi visual dan hanya boleh memahami kandungan teks diskret. Dan input visual biasanya mengandungi banyak maklumat tentang dunia, termasuk sifat objek, hubungan ruang, susun atur pemandangan, dsb. Kaedah biasa ialah:

  • Tukar input visual kepada penerangan teks yang sepadan (Kapsyen Imej): ia boleh difahami secara langsung oleh LLM dan mempunyai kebolehtafsiran yang tinggi.
  • Pengekodan dan mewakili maklumat visual: Modul persepsi terdiri daripada model asas visual + paradigma LLM, dan model memahami kandungan modaliti yang berbeza melalui operasi penjajaran, yang boleh dilatih secara hujung ke hujung.

Input pendengaran: Pendengaran juga merupakan bahagian penting dalam persepsi manusia. Memandangkan LLM mempunyai keupayaan panggilan alat yang sangat baik, idea intuitif ialah ejen boleh menggunakan LLM sebagai hab kawalan, memanggil set alat sedia ada atau model pakar secara berlatarkan untuk melihat maklumat audio. Selain itu, audio juga boleh diwakili secara visual melalui spektrogram. Spektrogram boleh digunakan sebagai imej rata untuk memaparkan maklumat 2D, jadi beberapa kaedah pemprosesan visual boleh dipindahkan ke medan pertuturan.

Input Lain: Maklumat dalam dunia sebenar adalah lebih daripada teks, penglihatan dan pendengaran. Penulis berharap pada masa akan datang, ejen pintar akan dilengkapi dengan modul persepsi yang lebih kaya, seperti sentuhan, bau dan organ lain, untuk mendapatkan atribut objek sasaran yang lebih kaya. Pada masa yang sama, ejen juga boleh mempunyai rasa yang jelas tentang suhu, kelembapan dan cahaya persekitaran sekeliling dan mengambil lebih banyak tindakan yang mementingkan alam sekitar.

Selain itu, ejen juga boleh diperkenalkan kepada persepsi persekitaran keseluruhan yang lebih luas: menggunakan modul persepsi matang seperti lidar, GPS, dan unit ukuran inersia.

Action end: Action

Selepas otak membuat analisis dan membuat keputusan, ejen juga perlu mengambil tindakan untuk menyesuaikan diri atau mengubah persekitaran:


keluaran Memandangkan kebolehan Paling Asas LLM tidak akan diterangkan di sini.

Penggunaan alatan:
Walaupun LLM mempunyai rizab pengetahuan dan keupayaan profesional yang sangat baik, apabila berhadapan dengan masalah tertentu, beberapa siri cabaran seperti isu keteguhan dan halusinasi mungkin timbul. Pada masa yang sama, alatan, sebagai lanjutan daripada keupayaan pengguna, boleh memberikan bantuan dalam aspek seperti profesionalisme, fakta dan kebolehtafsiran. Contohnya, anda boleh menggunakan kalkulator untuk menyelesaikan masalah matematik dan enjin carian untuk mencari maklumat masa nyata.

Selain itu, alatan juga boleh meluaskan ruang tindakan ejen pintar. Sebagai contoh, tindakan berbilang modal boleh diperoleh dengan memanggil model pakar seperti penjanaan pertuturan dan penjanaan imej. Oleh itu, bagaimana untuk menjadikan ejen menjadi pengguna alat yang sangat baik, iaitu, mempelajari cara menggunakan alat dengan berkesan, adalah hala tuju yang sangat penting dan menjanjikan.

Pada masa ini, kaedah pembelajaran alat utama termasuk belajar daripada demonstrasi dan belajar daripada maklum balas. Di samping itu, meta-pembelajaran, pembelajaran kursus, dan lain-lain juga boleh digunakan untuk menyediakan agen dengan keupayaan generalisasi dalam menggunakan pelbagai alat. Melangkah lebih jauh, ejen pintar boleh mempelajari lebih lanjut cara membuat alat "berdikari", dengan itu meningkatkan autonomi dan kebebasan mereka. 🎜🎜🎜🎜Tindakan terwujud: 🎜Embodiment merujuk kepada keupayaan ejen untuk memahami, mengubah persekitaran dan mengemas kini keadaannya sendiri semasa interaksi dengan persekitaran. Tindakan Terwujud dianggap sebagai jambatan antara kecerdasan maya dan realiti fizikal.

Ejen berasaskan pembelajaran pengukuhan tradisional mempunyai had dalam kecekapan sampel, generalisasi dan penaakulan masalah yang kompleks, manakala Ejen berasaskan LLM memperkenalkan pengetahuan intrinsik yang kaya tentang model besar, membolehkan Ejen Terjelma berkelakuan seperti manusia Mengesan dan mempengaruhi persekitaran fizikal secara aktif . Bergantung pada tahap autonomi ejen dalam tugas atau kerumitan Tindakan, mungkin terdapat Tindakan atom berikut:

  • Pemerhatian boleh membantu ejen pintar mengesan kedudukannya sendiri dalam persekitaran, melihat objek dan item, dan mendapatkan maklumat persekitaran yang lain; kepada maklumat alam sekitar.
  • Dengan menggabungkan tindakan atom ini, ejen boleh menyelesaikan tugas yang lebih kompleks. Contohnya, tugasan QA yang terkandung seperti "Adakah tembikai di dapur lebih besar daripada mangkuk?" Untuk menyelesaikan masalah ini, ejen perlu menavigasi ke dapur dan mendapatkan jawapan selepas memerhatikan saiz kedua-duanya.
Terhad oleh kos perkakasan dunia fizikal yang tinggi dan kekurangan set data yang terkandung, penyelidikan semasa mengenai tindakan yang terkandung masih tertumpu terutamanya pada persekitaran kotak pasir maya seperti platform permainan "Minecraft". Oleh itu, di satu pihak, penulis mengharapkan paradigma tugasan dan standard penilaian yang lebih dekat dengan realiti Sebaliknya, mereka juga memerlukan lebih banyak penerokaan mengenai pembinaan set data yang relevan.

Agen dalam Amalan: Senario aplikasi yang pelbagai

Pada masa ini, Ejen berasaskan LLM telah menunjukkan kepelbagaian yang mengagumkan dan prestasi yang hebat. Contoh aplikasi biasa seperti AutoGPT, MetaGPT, CAMEL dan GPT Engineer berkembang pesat pada kadar yang tidak pernah berlaku sebelum ini.
Sebelum memperkenalkan aplikasi khusus, penulis membincangkan prinsip reka bentuk Ejen dalam Amalan:
1. Bantu pengguna membebaskan diri mereka daripada tugas harian dan kerja berulang, mengurangkan tekanan kerja manusia, dan meningkatkan kecekapan kerja. tugas;
2. Pengguna tidak perlu lagi mengeluarkan arahan tahap rendah yang jelas, dan boleh menganalisis, merancang dan menyelesaikan masalah sepenuhnya secara autonomi
3 sains Beri permainan sepenuhnya kepada potensi mereka dalam bidang dan menyelesaikan kerja-kerja inovatif dan penerokaan. Pada dasar ini, penggunaan ejen boleh mempunyai tiga paradigma:

Tiga paradigma permohonan ejen berasaskan LLM: ejen tunggal, multi-agen, dan interaksi manusia-komputer. . Penulis pertama kali menghuraikan senario aplikasinya yang pelbagai dan keupayaan yang sepadan dalam senario aplikasi ejen pintar tunggal.

Dalam artikel ini, penggunaan ejen pintar tunggal dibahagikan kepada tiga peringkat berikut:

Pasukan NLP Fudan mengeluarkan gambaran keseluruhan 80 halaman ejen model berskala besar, memberikan gambaran keseluruhan keadaan semasa dan masa depan ejen AI dalam satu artikel的 Tiga peringkat senario aplikasi proksi tunggal: berorientasikan tugas, orientasi inovatif dan orientasi kitaran hayat.


Dalam penggunaan

    berorientasikan tugas
  • , ejen membantu pengguna manusia mengendalikan tugas harian asas. Mereka perlu mempunyai pemahaman arahan asas, penguraian tugas, dan keupayaan untuk berinteraksi dengan persekitaran. Secara khusus, mengikut jenis tugas sedia ada, aplikasi sebenar ejen boleh dibahagikan kepada persekitaran rangkaian simulasi dan senario kehidupan simulasi.
    Dalam penggunaan
  • berorientasikan inovasi
  • , ejen boleh menunjukkan potensi untuk siasatan bebas dalam bidang saintifik yang canggih. Walaupun kerumitan yang wujud dan kekurangan data latihan dari bidang khusus menghalang pembinaan ejen pintar, sudah ada banyak kerja yang membuat kemajuan dalam bidang seperti kimia, bahan, komputer, dll.
    Dalam
  • penggunaan berorientasikan kitaran hayat
  • , ejen mempunyai keupayaan untuk terus meneroka, mempelajari dan menggunakan kemahiran baharu dalam dunia terbuka, dan bertahan untuk jangka masa yang lama. Dalam bahagian ini, penulis mengambil permainan "Minecraft" sebagai contoh. Memandangkan cabaran kelangsungan hidup dalam permainan boleh dianggap sebagai mikrokosmos dunia sebenar, ramai penyelidik telah menggunakannya sebagai platform unik untuk membangun dan menguji keupayaan komprehensif ejen.

Senario Berbilang Ejen
Pada tahun 1986, Marvin Minsky membuat ramalan yang berpandangan ke hadapan. Dalam The Society of Mind, beliau mencadangkan teori baru tentang kecerdasan, dengan alasan bahawa kecerdasan timbul daripada interaksi banyak agen yang lebih kecil dan khusus fungsi. Sebagai contoh, sesetengah ejen mungkin bertanggungjawab untuk mengenal pasti corak, manakala yang lain mungkin bertanggungjawab untuk membuat keputusan atau menjana penyelesaian.
Idea ini telah dilaksanakan secara konkrit dengan peningkatan kecerdasan buatan teragih. Sistem Multi-Agen, sebagai salah satu isu penyelidikan utama, tertumpu terutamanya pada cara ejen boleh menyelaras dan bekerjasama dengan berkesan untuk menyelesaikan masalah. Pengarang artikel ini membahagikan interaksi antara berbilang ejen kepada dua bentuk berikut: dua bentuk interaksi

Pasukan NLP Fudan mengeluarkan gambaran keseluruhan 80 halaman ejen model berskala besar, memberikan gambaran keseluruhan keadaan semasa dan masa depan ejen AI dalam satu artikel

senario aplikasi berbilang ejen: interaksi koperasi dan interaksi konfrontasi. . Secara khusus, mengikut bentuk kerjasama yang berbeza, penulis membahagikan interaksi koperasi kepada kerjasama yang tidak teratur dan kerjasama yang teratur.
Apabila semua ejen bebas menyuarakan pandangan dan pendapat dan bekerjasama secara tidak berurutan, ia dipanggil kerjasama tidak teratur.

Apabila semua ejen mengikut peraturan tertentu seperti menyatakan pendapat mereka satu persatu dalam bentuk barisan perhimpunan, keseluruhan proses kerjasama adalah teratur, yang dinamakan kerjasama tertib.
Interaksi musuh:
    Ejen pintar berinteraksi secara tit-for-tat. Melalui persaingan, rundingan dan perdebatan, ejen meninggalkan kepercayaan asal mereka yang mungkin salah dan menjalankan refleksi yang bermakna tentang tingkah laku atau proses penaakulan mereka sendiri, yang akhirnya membawa kepada peningkatan dalam kualiti tindak balas keseluruhan sistem.
  • Senario interaksi manusia-komputer
Interaksi Manusia-Ejen, seperti namanya, adalah ejen pintar yang bekerjasama dengan manusia untuk menyelesaikan tugas. Di satu pihak, keupayaan pembelajaran dinamik ejen perlu disokong oleh komunikasi sebaliknya, prestasi sistem ejen semasa dalam kebolehtafsiran masih tidak mencukupi, dan mungkin terdapat masalah dalam keselamatan, kesahihan, dan lain-lain, jadi ia memerlukan manusia; penyertaan.

Pengarang membahagikan interaksi Manusia-Agen kepada dua mod berikut dalam kertas:
的 Dua mod adegan interaksi manusia-mesin: Mod Pengajar-PELAKSANA lwn mod PERKONGSIAN Sama.
    Mod Pengajar-Pelaksana
  • : Manusia bertindak sebagai pengajar, memberi arahan dan maklum balas, ejen bertindak sebagai pelaksana, secara beransur-ansur menyesuaikan dan mengoptimumkan mengikut arahan. Model ini telah digunakan secara meluas dalam bidang pendidikan, perubatan, perniagaan dan lain-lain.
  • Mod Perkongsian Setara:
  • Sesetengah kajian mendapati bahawa ejen boleh menunjukkan empati dalam komunikasi dengan manusia, atau mengambil bahagian dalam pelaksanaan tugas secara sama rata. Agen pintar menunjukkan potensi untuk diaplikasikan dalam kehidupan seharian dan diharapkan dapat diintegrasikan ke dalam masyarakat manusia pada masa hadapan.

Masyarakat Ejen: Dari personaliti kepada sosialiti

Sejak sekian lama, penyelidik mengimpikan untuk membina "masyarakat buatan interaktif", daripada permainan kotak pasir "Meta Sims" "Universe", definisi masyarakat simulasi boleh diringkaskan sebagai: persekitaran + individu yang hidup dan berinteraksi dalam persekitaran.

Dalam artikel tersebut, penulis menggunakan gambar rajah untuk menerangkan kerangka konseptual masyarakat Agen:

念 Rangka kerja konsep masyarakat agensi dibahagikan kepada dua bahagian utama: agensi dan persekitaran.


Dalam rangka kerja ini, kita boleh lihat:

    Bahagian kiri:
  1. Di peringkat individu, ejen yang dicerminkan mempamerkan alasan yang jelas. . Selain itu, ejen mempamerkan ciri personaliti intrinsik yang merangkumi dimensi kognitif, emosi dan personaliti.
  2. Bahagian tengah:
  3. Ejen tunggal boleh membentuk kumpulan dengan ejen individu lain untuk bersama-sama mempamerkan tingkah laku kumpulan seperti kerjasama, seperti kerjasama kolaboratif.
  4. Bahagian kanan:
  5. Persekitaran boleh dalam bentuk persekitaran kotak pasir maya atau dunia fizikal sebenar. Elemen alam sekitar merangkumi aktor manusia dan pelbagai sumber yang ada. Untuk ejen tunggal, ejen lain juga merupakan sebahagian daripada persekitaran.
  6. Interaksi keseluruhan:
  7. Ejen mengambil bahagian secara aktif dalam keseluruhan proses interaksi dengan merasakan persekitaran luaran dan mengambil tindakan.

Tingkah laku sosial dan keperibadian ejen

Artikel mengkaji prestasi ejen dalam masyarakat dari perspektif tingkah laku luaran dan personaliti dalaman
Tingkah laku sosial :
Dari perspektif sosial, tingkah laku boleh dibahagikan kepada dua peringkat: individu dan kolektif:

Tingkah laku individu membentuk asas untuk operasi dan perkembangan ejen itu sendiri. Ia termasuk input yang diwakili oleh persepsi, output yang diwakili oleh tindakan, dan tingkah laku dalaman ejen itu sendiri.

    Tingkah laku kawanan merujuk kepada tingkah laku yang berlaku apabila dua atau lebih agen berinteraksi secara spontan. Ia termasuk tingkah laku positif yang diwakili oleh kerjasama, tingkah laku negatif yang diwakili oleh konflik, dan tingkah laku neutral seperti mengikut kumpulan dan memerhati.
  • Personaliti:
Termasuk kognisi, emosi dan personaliti. Sama seperti manusia secara beransur-ansur mengembangkan sifat mereka melalui proses sosialisasi, agen juga mempamerkan apa yang dipanggil "kecerdasan seperti manusia", yang merupakan pembentukan beransur-ansur personaliti melalui interaksi dengan kumpulan dan persekitaran.

Kebolehan kognitif: Merangkumi proses di mana ejen memperoleh dan memahami pengetahuan Penyelidikan menunjukkan bahawa ejen berasaskan LLM boleh mempamerkan pertimbangan dan kecerdasan yang serupa dengan manusia dalam beberapa aspek.

    Kecerdasan emosi: melibatkan perasaan subjektif dan keadaan emosi, seperti kegembiraan, kemarahan, kesedihan, dan kegembiraan, serta keupayaan untuk menunjukkan simpati dan empati.
  • Penggambaran watak: Untuk memahami dan menganalisis ciri personaliti LLM, penyelidik telah menggunakan kaedah penilaian matang, seperti ujian Personaliti Lima Besar dan MBTI, untuk meneroka kepelbagaian dan kerumitan personaliti.
  • Simulasikan persekitaran operasi masyarakat

Masyarakat ejen bukan sahaja terdiri daripada individu yang berdikari, tetapi juga merangkumi persekitaran di mana mereka berinteraksi. Persekitaran mempengaruhi cara ejen melihat, bertindak, dan berinteraksi. Seterusnya, ejen juga mengubah keadaan persekitaran melalui tindakan dan keputusan mereka. Bagi ejen individu, persekitaran termasuk ejen autonomi lain, manusia dan sumber yang ada.

Di sini, pengarang meneroka tiga jenis persekitaran:

Persekitaran berasaskan teks:
Memandangkan LLM bergantung terutamanya pada bahasa kerana format input dan output mereka adalah kebanyakannya berasaskan teks untuk persekitaran semula jadi. platform operasi. Fenomena dan interaksi sosial diterangkan melalui kata-kata, dan persekitaran teks menyediakan pengetahuan semantik dan latar belakang. Ejen wujud dalam dunia teks dan bergantung pada sumber teks untuk memahami, menaakul dan bertindak.

Persekitaran Kotak Pasir Maya:
Dalam medan komputer, kotak pasir merujuk kepada persekitaran terkawal dan terpencil, sering digunakan untuk ujian perisian dan analisis virus. Persekitaran kotak pasir maya masyarakat ejen ialah platform untuk mensimulasikan interaksi sosial dan simulasi tingkah laku Ciri-ciri utamanya termasuk:

Visualisasi: Anda boleh menggunakan antara muka grafik 2D yang ringkas atau pemodelan 3D yang kompleks untuk memaparkan dunia , menggambarkan semua aspek masyarakat simulasi dengan cara yang intuitif.

    Skalabiliti: Pelbagai senario berbeza (Web, permainan, dll.) boleh dibina dan digunakan untuk menjalankan pelbagai eksperimen, menyediakan ruang yang luas untuk ejen meneroka.
  • Persekitaran Fizikal Sebenar:
Persekitaran fizikal ialah persekitaran ketara yang terdiri daripada objek dan ruang sebenar di mana ejen memerhati dan bertindak. Persekitaran ini memperkenalkan input deria yang kaya (visual, pendengaran dan ruang). Tidak seperti persekitaran maya, ruang fizikal meletakkan lebih banyak permintaan pada tingkah laku ejen. Iaitu, ejen mesti boleh menyesuaikan diri dalam persekitaran fizikal dan menjana kawalan gerakan boleh laku.

Pengarang memberi contoh untuk menerangkan kerumitan persekitaran fizikal: bayangkan agen pintar mengendalikan lengan robot di kilang Apabila mengendalikan lengan robot, kawalan daya yang tepat diperlukan untuk mengelakkan objek daripada bahan yang berbeza ; sebagai tambahan, ejen Ia adalah perlu untuk menavigasi dalam ruang kerja fizikal dan menyesuaikan laluan pergerakan dalam masa untuk mengelakkan halangan dan mengoptimumkan trajektori pergerakan lengan robot.

Keperluan ini meningkatkan kerumitan dan cabaran ejen dalam persekitaran fizikal.

Simulasi, mulakan!

Dalam artikel itu, penulis percaya bahawa masyarakat yang disimulasikan harus terbuka, gigih, mengikut situasi dan teratur. Keterbukaan membolehkan ejen memasuki dan meninggalkan masyarakat yang disimulasikan secara autonomi bermakna masyarakat mempunyai trajektori yang koheren yang berkembang dari semasa ke semasa menekankan kewujudan dan operasi subjek dalam persekitaran tertentu memastikan masyarakat yang disimulasikan mempunyai dunia fizikal; seperti peraturan dan sekatan.

Mengenai kepentingan masyarakat simulasi, bandar Ejen Generatif di Universiti Stanford memberikan contoh yang jelas untuk semua orang - Masyarakat ejen boleh digunakan untuk meneroka sempadan keupayaan perisikan kumpulan, contohnya, ejen secara bersama menganjurkan pesta Hari Valentine ; Ia juga boleh digunakan untuk mempercepatkan penyelidikan sains sosial, seperti memerhati fenomena komunikasi dengan mensimulasikan rangkaian sosial. Di samping itu, terdapat juga kajian untuk meneroka nilai di sebalik ejen dengan mensimulasikan senario membuat keputusan beretika, dan untuk membantu membuat keputusan dengan mensimulasikan kesan dasar terhadap masyarakat.

Selanjutnya, pengarang menunjukkan bahawa simulasi ini juga mungkin mempunyai risiko tertentu, termasuk tetapi tidak terhad kepada: stereotaip dan prasangka yang berlebihan; Soalan-soalan terbuka yang berpandangan jauh dari akhir kertas, penulis juga membincangkan beberapa soalan terbuka yang berpandangan ke hadapan untuk memberi inspirasi kepada pembaca untuk memikirkan: ejen dan model bahasa besar Bagaimanakah penyelidikan kita boleh mempromosikan satu sama lain dan berkembang bersama?
Model besar telah menunjukkan potensi yang kuat dalam pemahaman bahasa, membuat keputusan dan keupayaan generalisasi, dan telah menjadi peranan utama dalam proses pembinaan ejen juga telah mengemukakan keperluan yang lebih tinggi untuk model besar.

Apakah cabaran dan kebimbangan yang akan dibawa oleh Ejen berasaskan LLM?
Sama ada ejen pintar benar-benar boleh diamalkan memerlukan penilaian keselamatan yang rapi untuk mengelakkan bahaya kepada dunia sebenar. Penulis merumuskan lebih banyak ancaman yang berpotensi, seperti: penyalahgunaan haram, risiko pengangguran, kesan terhadap kesejahteraan manusia, dsb.

Apakah peluang dan cabaran yang akan dibawa oleh peningkatan?
Dalam masyarakat simulasi, menambah bilangan individu boleh meningkatkan kredibiliti dan ketulenan simulasi dengan ketara. Walau bagaimanapun, apabila bilangan ejen meningkat, masalah komunikasi dan penyebaran mesej akan menjadi agak rumit, dan herotan maklumat, salah faham atau halusinasi akan mengurangkan kecekapan keseluruhan sistem simulasi dengan ketara.

Perdebatan di Internet tentang sama ada Agen berasaskan LLM adalah laluan yang sesuai untuk AGI.
Sesetengah penyelidik percaya bahawa model besar yang diwakili oleh GPT-4 telah dilatih dengan korpus yang mencukupi, dan ejen yang dibina atas dasar ini berpotensi menjadi kunci untuk membuka pintu kepada AGI. Tetapi penyelidik lain percaya bahawa pemodelan bahasa auto-regresif tidak menunjukkan kecerdasan sebenar kerana mereka hanya bertindak balas. Kaedah pemodelan yang lebih lengkap, seperti Model Dunia, boleh membawa kepada AGI.
Evolusi kecerdasan swarm. Perisikan khalayak ialah satu proses mengumpul pendapat ramai orang dan mengubahnya menjadi keputusan.
Namun, adakah "kepintaran" sebenar akan dihasilkan dengan hanya menambah bilangan ejen? Di samping itu, bagaimana untuk menyelaraskan ejen individu untuk membolehkan masyarakat ejen pintar mengatasi "groupthink" dan kecenderungan kognitif peribadi?

Ejen sebagai Perkhidmatan (AaaS).
Memandangkan Ejen berasaskan LLM adalah lebih kompleks daripada model besar itu sendiri, dan lebih sukar untuk perusahaan atau individu bersaiz kecil dan sederhana untuk membina secara tempatan, vendor awan boleh mempertimbangkan untuk melaksanakan ejen pintar dalam bentuk perkhidmatan, iaitu, Agen- sebagai-Perkhidmatan. Seperti perkhidmatan awan lain, AaaS berpotensi untuk menyediakan pengguna dengan fleksibiliti tinggi dan layan diri atas permintaan.

Atas ialah kandungan terperinci Pasukan NLP Fudan mengeluarkan gambaran keseluruhan 80 halaman ejen model berskala besar, memberikan gambaran keseluruhan keadaan semasa dan masa depan ejen AI dalam satu artikel. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:jiqizhixin.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam