


- Pautan kertas: https://arxiv.org/pdf/2309.07864.pdf
- Senarai kertas Agen berasaskan LLM: https://github.com/WooooDyy/LLM-Agenty-LLM-Agenty Ahli pasukan senarai
Sejak sekian lama, penyelidik telah mengejar
Sejak itu, reka bentuk ejen telah menjadi tumpuan komuniti kecerdasan buatan. Walau bagaimanapun, kerja lepas terutamanya tertumpu pada meningkatkan kebolehan khusus ejen, seperti penaakulan simbolik atau penguasaan tugas tertentu (catur, Pergi, dll.). Kajian-kajian ini lebih menumpukan pada reka bentuk algoritma dan strategi latihan, sambil mengabaikan pembangunan keupayaan am yang wujud bagi model, seperti ingatan pengetahuan, perancangan jangka panjang, generalisasi yang berkesan dan interaksi yang cekap. Ternyata
Kemunculan model bahasa besar (LLM) membawa harapan untuk perkembangan selanjutnya ejen pintar. Jika laluan pembangunan dari NLP ke AGI dibahagikan kepada lima peringkat: korpus, Internet, persepsi, penjelmaan, dan atribut sosial, maka model bahasa berskala besar semasa telah mencapai tahap kedua, dengan input dan output teks berskala Internet. Atas dasar ini, jika Agen berasaskan LLM diberi ruang persepsi dan ruang tindakan, mereka akan mencapai tahap ketiga dan keempat. Tambahan pula, apabila pelbagai ejen berinteraksi dan bekerjasama untuk menyelesaikan tugas yang lebih kompleks, atau mencerminkan tingkah laku sosial dalam dunia sebenar, mereka berpotensi untuk mencapai tahap kelima - masyarakat ejen.
一 Imaginasi pengarang tentang masyarakat harmoni yang terdiri daripada agen pintar juga boleh menyertainya. Adegan ini diambil dari Festival Tanglung Laut dalam "Genshin Impact". . Diilhamkan oleh undang-undang "survival of the fittest" Darwin, pengarang mencadangkan rangka kerja umum untuk ejen pintar berdasarkan model besar. Sekiranya seseorang itu ingin terus hidup dalam masyarakat, dia mesti belajar menyesuaikan diri dengan persekitaran, jadi dia perlu mempunyai kebolehan kognitif dan dapat melihat dan bertindak balas terhadap perubahan di dunia luar. Begitu juga, rangka kerja ejen pintar juga terdiri daripada tiga bahagian:
Sisi mudah alih
-
S Rangka kerja konsep EJEN BERASASKAN LLM mengandungi tiga komponen: terminal kawalan, persepsi dan penamat tindakan. Pengarang menggunakan contoh untuk menggambarkan aliran kerja Ejen berasaskan LLM: apabila manusia bertanya sama ada hujan akan turun, penghujung persepsi (Persepsi) menukar arahan menjadi representasi yang boleh difahami oleh LLM. Kemudian terminal kawalan (Otak) memulakan penaakulan dan perancangan tindakan berdasarkan ramalan cuaca dan cuaca semasa di Internet. Akhirnya, Tindakan bertindak balas dan menyerahkan payung kepada manusia. Dengan mengulangi proses di atas, ejen pintar boleh terus mendapatkan maklum balas dan berinteraksi dengan persekitaran.Control terminal: Brain Sebagai komponen teras ejen pintar, pengarang memperkenalkan keupayaannya dari lima aspek: interaksi bahasa sebuah medium komunikasi yang mengandungi maklumat yang kaya. Terima kasih kepada penjanaan bahasa semula jadi yang berkuasa dan keupayaan pemahaman LLM, ejen pintar boleh berinteraksi dengan dunia luar untuk berbilang pusingan melalui bahasa semula jadi untuk mencapai matlamat mereka. Secara khusus, ia boleh dibahagikan kepada dua aspek: Penjanaan teks berkualiti tinggi: Sebilangan besar eksperimen penilaian menunjukkan bahawa LLM boleh menghasilkan teks yang lancar, pelbagai, novel dan boleh dikawal. Walaupun prestasi lemah dalam bahasa individu, kemahiran berbilang bahasa yang baik secara keseluruhan tersedia. Pemahaman tentang implikasi: Selain kandungan yang dinyatakan secara intuitif, bahasa juga boleh menyampaikan maklumat seperti niat dan pilihan penutur. Implikasinya ialah ia membantu ejen berkomunikasi dan bekerjasama dengan lebih cekap, dan model besar telah pun menunjukkan potensi dalam hal ini.- Pengetahuan: LLM yang dilatih berdasarkan kumpulan besar korpus mempunyai keupayaan untuk menyimpan sejumlah besar pengetahuan. Selain pengetahuan bahasa, pengetahuan akal dan pengetahuan kemahiran profesional adalah komponen penting Agen berasaskan LLM.
Walaupun LLM sendiri masih menghadapi masalah seperti luput pengetahuan dan halusinasi, beberapa penyelidikan sedia ada boleh diringankan pada tahap tertentu melalui kaedah seperti penyuntingan pengetahuan atau memanggil pangkalan pengetahuan luar. Memori:Dalam rangka artikel ini, modul memori (Memori) menyimpan urutan pemerhatian, pemikiran dan tindakan ejen yang lalu. Melalui mekanisme ingatan khusus, ejen boleh merenung dan menggunakan strategi sebelumnya dengan berkesan, membolehkan mereka menggunakan pengalaman lalu untuk menyesuaikan diri dengan persekitaran yang tidak dikenali. Terdapat tiga kaedah yang biasanya digunakan untuk meningkatkan keupayaan ingatan: Melanjutkan had panjang seni bina Backbone: menambah baik masalah had panjang jujukan sedia ada Transformers. Ringkaskan: Meringkaskan ingatan untuk meningkatkan keupayaan ejen untuk mengekstrak butiran penting daripada ingatan.- Memori termampat (Memampatkan): Dengan memampatkan memori menggunakan vektor atau struktur data yang sesuai, kecekapan mendapatkan semula ingatan boleh dipertingkatkan.
Selain itu, kaedah cari semula ingatan juga sangat penting Hanya dengan mendapatkan semula kandungan yang sesuai boleh ejen mengakses maklumat yang paling relevan dan tepat.
Penaakulan & Perancangan:Keupayaan penaakulan adalah penting untuk ejen pintar melaksanakan tugas yang rumit seperti membuat keputusan dan analisis. Khusus untuk LLM, ia adalah satu siri kaedah dorongan yang diwakili oleh Rantaian Pemikiran (CoT). Perancangan adalah strategi yang biasa digunakan apabila menghadapi cabaran besar. Ia membantu ejen mengatur pemikiran mereka, menetapkan matlamat dan mengenal pasti langkah untuk mencapai matlamat tersebut. Dalam pelaksanaan khusus, perancangan boleh merangkumi dua langkah: Penggubalan Rancangan: Ejen membahagikan tugas yang kompleks kepada subtugas yang lebih terurus. Contohnya: penguraian satu kali dan kemudian pelaksanaan dalam urutan, perancangan dan pelaksanaan langkah demi langkah, perancangan berbilang laluan dan pemilihan laluan optimum, dsb. Dalam sesetengah senario yang memerlukan pengetahuan profesional, ejen boleh disepadukan dengan modul Perancang khusus domain untuk meningkatkan keupayaan. Refleksi Rancangan: Selepas membuat perancangan, anda boleh merenung dan menilai kekuatan dan kelemahannya. Refleksi ini secara amnya datang dari tiga aspek: menggunakan mekanisme maklum balas dalaman mendapatkan maklum balas daripada berinteraksi dengan manusia dan mendapatkan maklum balas daripada persekitaran;- Kebolehpindahan & Generalisasi: LLM dengan pengetahuan dunia memberikan agen pintar dengan keupayaan penghijrahan dan generalisasi yang berkuasa. Ejen yang baik bukanlah asas pengetahuan yang statik, tetapi juga harus mempunyai keupayaan pembelajaran dinamik:
Generalisasi kepada tugas yang tidak diketahui: Apabila saiz model dan data latihan meningkat, LLM muncul untuk menyelesaikan tugas yang tidak diketahui Mempunyai kebolehan yang menakjubkan .Model besar diperhalusi dengan arahan berprestasi baik dalam ujian sifar pukulan, mencapai keputusan yang sebaik model pakar dalam banyak tugas. Pembelajaran Dalam Konteks: Model besar bukan sahaja dapat belajar melalui analogi daripada sebilangan kecil contoh dalam konteks, keupayaan ini juga boleh diperluaskan kepada adegan berbilang modal di luar teks, menyediakan aplikasi dunia sebenar untuk ejen Menyediakan lebih banyak kemungkinan. Pembelajaran Berterusan: Cabaran utama pembelajaran berterusan ialah melupakan bencana, iaitu apabila model mempelajari tugasan baru, ia mudah kehilangan pengetahuan dalam tugasan lepas. Ejen pintar dalam domain khusus harus cuba mengelakkan kehilangan pengetahuan dalam domain umum.
Tukar input visual kepada penerangan teks yang sepadan (Kapsyen Imej): ia boleh difahami secara langsung oleh LLM dan mempunyai kebolehtafsiran yang tinggi. Pengekodan dan mewakili maklumat visual: Modul persepsi terdiri daripada model asas visual + paradigma LLM, dan model memahami kandungan modaliti yang berbeza melalui operasi penjajaran, yang boleh dilatih secara hujung ke hujung.
Pemerhatian boleh membantu ejen pintar mengesan kedudukannya sendiri dalam persekitaran, melihat objek dan item, dan mendapatkan maklumat persekitaran yang lain; kepada maklumat alam sekitar. - Dengan menggabungkan tindakan atom ini, ejen boleh menyelesaikan tugas yang lebih kompleks. Contohnya, tugasan QA yang terkandung seperti "Adakah tembikai di dapur lebih besar daripada mangkuk?" Untuk menyelesaikan masalah ini, ejen perlu menavigasi ke dapur dan mendapatkan jawapan selepas memerhatikan saiz kedua-duanya.
Agen dalam Amalan: Senario aplikasi yang pelbagai
的 Tiga peringkat senario aplikasi proksi tunggal: berorientasikan tugas, orientasi inovatif dan orientasi kitaran hayat.
- berorientasikan tugas
- , ejen membantu pengguna manusia mengendalikan tugas harian asas. Mereka perlu mempunyai pemahaman arahan asas, penguraian tugas, dan keupayaan untuk berinteraksi dengan persekitaran. Secara khusus, mengikut jenis tugas sedia ada, aplikasi sebenar ejen boleh dibahagikan kepada persekitaran rangkaian simulasi dan senario kehidupan simulasi.
Dalam penggunaan berorientasikan inovasi - , ejen boleh menunjukkan potensi untuk siasatan bebas dalam bidang saintifik yang canggih. Walaupun kerumitan yang wujud dan kekurangan data latihan dari bidang khusus menghalang pembinaan ejen pintar, sudah ada banyak kerja yang membuat kemajuan dalam bidang seperti kimia, bahan, komputer, dll.
Dalam penggunaan berorientasikan kitaran hayat - , ejen mempunyai keupayaan untuk terus meneroka, mempelajari dan menggunakan kemahiran baharu dalam dunia terbuka, dan bertahan untuk jangka masa yang lama. Dalam bahagian ini, penulis mengambil permainan "Minecraft" sebagai contoh. Memandangkan cabaran kelangsungan hidup dalam permainan boleh dianggap sebagai mikrokosmos dunia sebenar, ramai penyelidik telah menggunakannya sebagai platform unik untuk membangun dan menguji keupayaan komprehensif ejen.
Senario Berbilang Ejen
Apabila semua ejen mengikut peraturan tertentu seperti menyatakan pendapat mereka satu persatu dalam bentuk barisan perhimpunan, keseluruhan proses kerjasama adalah teratur, yang dinamakan kerjasama tertib.
- Ejen pintar berinteraksi secara tit-for-tat. Melalui persaingan, rundingan dan perdebatan, ejen meninggalkan kepercayaan asal mereka yang mungkin salah dan menjalankan refleksi yang bermakna tentang tingkah laku atau proses penaakulan mereka sendiri, yang akhirnya membawa kepada peningkatan dalam kualiti tindak balas keseluruhan sistem.
Senario interaksi manusia-komputer
- Mod Pengajar-Pelaksana
- : Manusia bertindak sebagai pengajar, memberi arahan dan maklum balas, ejen bertindak sebagai pelaksana, secara beransur-ansur menyesuaikan dan mengoptimumkan mengikut arahan. Model ini telah digunakan secara meluas dalam bidang pendidikan, perubatan, perniagaan dan lain-lain.
- Sesetengah kajian mendapati bahawa ejen boleh menunjukkan empati dalam komunikasi dengan manusia, atau mengambil bahagian dalam pelaksanaan tugas secara sama rata. Agen pintar menunjukkan potensi untuk diaplikasikan dalam kehidupan seharian dan diharapkan dapat diintegrasikan ke dalam masyarakat manusia pada masa hadapan.
Sejak sekian lama, penyelidik mengimpikan untuk membina "masyarakat buatan interaktif", daripada permainan kotak pasir "Meta Sims" "Universe", definisi masyarakat simulasi boleh diringkaskan sebagai: persekitaran + individu yang hidup dan berinteraksi dalam persekitaran.
Dalam artikel tersebut, penulis menggunakan gambar rajah untuk menerangkan kerangka konseptual masyarakat Agen:
念 Rangka kerja konsep masyarakat agensi dibahagikan kepada dua bahagian utama: agensi dan persekitaran.
Dalam rangka kerja ini, kita boleh lihat:
- Bahagian kiri:
- Di peringkat individu, ejen yang dicerminkan mempamerkan alasan yang jelas. . Selain itu, ejen mempamerkan ciri personaliti intrinsik yang merangkumi dimensi kognitif, emosi dan personaliti.
- Ejen tunggal boleh membentuk kumpulan dengan ejen individu lain untuk bersama-sama mempamerkan tingkah laku kumpulan seperti kerjasama, seperti kerjasama kolaboratif.
- Persekitaran boleh dalam bentuk persekitaran kotak pasir maya atau dunia fizikal sebenar. Elemen alam sekitar merangkumi aktor manusia dan pelbagai sumber yang ada. Untuk ejen tunggal, ejen lain juga merupakan sebahagian daripada persekitaran.
- Ejen mengambil bahagian secara aktif dalam keseluruhan proses interaksi dengan merasakan persekitaran luaran dan mengambil tindakan.
Tingkah laku sosial dan keperibadian ejen
Artikel mengkaji prestasi ejen dalam masyarakat dari perspektif tingkah laku luaran dan personaliti dalaman
- Tingkah laku kawanan merujuk kepada tingkah laku yang berlaku apabila dua atau lebih agen berinteraksi secara spontan. Ia termasuk tingkah laku positif yang diwakili oleh kerjasama, tingkah laku negatif yang diwakili oleh konflik, dan tingkah laku neutral seperti mengikut kumpulan dan memerhati.
- Personaliti:
- Kecerdasan emosi: melibatkan perasaan subjektif dan keadaan emosi, seperti kegembiraan, kemarahan, kesedihan, dan kegembiraan, serta keupayaan untuk menunjukkan simpati dan empati.
- Penggambaran watak: Untuk memahami dan menganalisis ciri personaliti LLM, penyelidik telah menggunakan kaedah penilaian matang, seperti ujian Personaliti Lima Besar dan MBTI, untuk meneroka kepelbagaian dan kerumitan personaliti.
- Simulasikan persekitaran operasi masyarakat
- Skalabiliti: Pelbagai senario berbeza (Web, permainan, dll.) boleh dibina dan digunakan untuk menjalankan pelbagai eksperimen, menyediakan ruang yang luas untuk ejen meneroka.
- Persekitaran Fizikal Sebenar:
Sesetengah penyelidik percaya bahawa model besar yang diwakili oleh GPT-4 telah dilatih dengan korpus yang mencukupi, dan ejen yang dibina atas dasar ini berpotensi menjadi kunci untuk membuka pintu kepada AGI. Tetapi penyelidik lain percaya bahawa pemodelan bahasa auto-regresif tidak menunjukkan kecerdasan sebenar kerana mereka hanya bertindak balas. Kaedah pemodelan yang lebih lengkap, seperti Model Dunia, boleh membawa kepada AGI.
Namun, adakah "kepintaran" sebenar akan dihasilkan dengan hanya menambah bilangan ejen? Di samping itu, bagaimana untuk menyelaraskan ejen individu untuk membolehkan masyarakat ejen pintar mengatasi "groupthink" dan kecenderungan kognitif peribadi?
Ejen sebagai Perkhidmatan (AaaS). Memandangkan Ejen berasaskan LLM adalah lebih kompleks daripada model besar itu sendiri, dan lebih sukar untuk perusahaan atau individu bersaiz kecil dan sederhana untuk membina secara tempatan, vendor awan boleh mempertimbangkan untuk melaksanakan ejen pintar dalam bentuk perkhidmatan, iaitu, Agen- sebagai-Perkhidmatan. Seperti perkhidmatan awan lain, AaaS berpotensi untuk menyediakan pengguna dengan fleksibiliti tinggi dan layan diri atas permintaan.
Atas ialah kandungan terperinci Pasukan NLP Fudan mengeluarkan gambaran keseluruhan 80 halaman ejen model berskala besar, memberikan gambaran keseluruhan keadaan semasa dan masa depan ejen AI dalam satu artikel. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Dalam buku seminal John Rawls pada tahun 1971 The Theory of Justice, beliau mencadangkan percubaan pemikiran yang harus kita ambil sebagai inti reka bentuk AI hari ini dan menggunakan keputusan: tudung kejahilan. Falsafah ini menyediakan alat yang mudah untuk memahami ekuiti dan juga menyediakan pelan tindakan untuk pemimpin untuk menggunakan pemahaman ini untuk mereka bentuk dan melaksanakan AI dengan cara yang saksama. Bayangkan anda membuat peraturan untuk masyarakat baru. Tetapi ada premis: anda tidak tahu terlebih dahulu apa peranan yang akan anda mainkan dalam masyarakat ini. Anda mungkin menjadi kaya atau miskin, sihat atau kurang upaya, milik majoriti atau minoriti marginal. Beroperasi di bawah "VEIL OF KETIGA" ini menghalang pembuat peraturan daripada membuat keputusan yang memberi manfaat kepada diri mereka sendiri. Sebaliknya, orang akan lebih bermotivasi untuk merumuskan orang ramai

Banyak syarikat yang mengkhususkan diri dalam Automasi Proses Robot (RPA), menawarkan bot untuk mengautomasikan tugas berulang -UIPATH, Automasi di mana sahaja, Prism Blue, dan lain -lain. Sementara itu, proses perlombongan, orkestrasi, dan pemprosesan dokumen pintar Special

Masa depan AI bergerak melampaui ramalan kata mudah dan simulasi perbualan; Ejen AI muncul, mampu tindakan bebas dan penyelesaian tugas. Peralihan ini sudah jelas dalam alat seperti Claude Anthropic. Ejen AI: Penyelidikan a

Kemajuan teknologi yang pesat memerlukan perspektif yang berpandangan ke hadapan pada masa depan kerja. Apa yang berlaku apabila AI melampaui peningkatan produktiviti semata -mata dan mula membentuk struktur masyarakat kita? Buku yang akan datang Topher McDougal, Gaia Wakes:

Klasifikasi produk, sering melibatkan kod kompleks seperti "HS 8471.30" dari sistem seperti sistem harmoni (HS), adalah penting untuk perdagangan antarabangsa dan jualan domestik. Kod ini memastikan permohonan cukai yang betul, memberi kesan kepada setiap inv

Masa Depan Penggunaan Tenaga di Pusat Data dan Pelaburan Teknologi Iklim Artikel ini menerangkan lonjakan penggunaan tenaga di pusat data yang didorong oleh AI dan kesannya terhadap perubahan iklim, dan menganalisis penyelesaian inovatif dan cadangan dasar untuk menangani cabaran ini. Cabaran Permintaan Tenaga: Pusat data besar-besaran dan ultra-besar menggunakan kuasa besar, setanding dengan jumlah beratus-ratus ribu keluarga Amerika Utara yang biasa, dan pusat-pusat skala ultra-besar AI yang muncul menggunakan puluhan kali lebih banyak kuasa daripada ini. Dalam lapan bulan pertama 2024, Microsoft, Meta, Google dan Amazon telah melabur kira -kira AS $ 125 bilion dalam pembinaan dan operasi pusat data AI (JP Morgan, 2024) (Jadual 1). Permintaan tenaga yang semakin meningkat adalah satu cabaran dan peluang. Menurut Canary Media, elektrik yang menjulang

AI Generatif merevolusi pengeluaran filem dan televisyen. Model Ray 2 Luma, serta Runway's Gen-4, Openai's Sora, Veo Google dan model-model baru yang lain, meningkatkan kualiti video yang dihasilkan pada kelajuan yang belum pernah terjadi sebelumnya. Model-model ini dengan mudah boleh mewujudkan kesan khas yang kompleks dan adegan yang realistik, walaupun klip video pendek dan kesan gerakan yang diperolehi oleh kamera telah dicapai. Walaupun manipulasi dan konsistensi alat -alat ini masih perlu diperbaiki, kelajuan kemajuan adalah menakjubkan. Video generatif menjadi medium bebas. Sesetengah model baik pada pengeluaran animasi, sementara yang lain baik pada imej aksi langsung. Perlu diingat bahawa Firefly Adobe dan Moonvalley's Ma

Pengalaman Pengguna CHATGPT Menolak: Adakah Degradasi Model atau Harapan Pengguna? Baru -baru ini, sebilangan besar pengguna berbayar ChatGPT telah mengadu tentang kemerosotan prestasi mereka, yang telah menarik perhatian yang meluas. Pengguna melaporkan tindak balas yang lebih perlahan terhadap model, jawapan yang lebih pendek, kekurangan bantuan, dan lebih banyak halusinasi. Sesetengah pengguna menyatakan rasa tidak puas hati di media sosial, menunjukkan bahawa ChatGPT telah menjadi "terlalu menyanjung" dan cenderung untuk mengesahkan pandangan pengguna dan bukannya memberikan maklum balas kritikal. Ini bukan sahaja memberi kesan kepada pengalaman pengguna, tetapi juga membawa kerugian sebenar kepada pelanggan korporat, seperti mengurangkan produktiviti dan pembaziran sumber pengkomputeran. Bukti kemerosotan prestasi Ramai pengguna telah melaporkan kemerosotan yang ketara dalam prestasi CHATGPT, terutamanya dalam model yang lebih lama seperti GPT-4 (yang tidak lama lagi akan dihentikan dari perkhidmatan pada akhir bulan ini). ini


Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Penyesuai Pelayan SAP NetWeaver untuk Eclipse
Integrasikan Eclipse dengan pelayan aplikasi SAP NetWeaver.

Muat turun versi mac editor Atom
Editor sumber terbuka yang paling popular

SecLists
SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

EditPlus versi Cina retak
Saiz kecil, penyerlahan sintaks, tidak menyokong fungsi gesaan kod
