


Kuantiti adalah kuasa! Tencent mendedahkan: Lebih banyak bilangan ejen, lebih baik kesan model bahasa besar
Pasukan penyelidik Tencent menjalankan kajian tentang kebolehskalaan ejen. Mereka mendapati bahawa melalui pengundian pensampelan mudah, prestasi model bahasa besar (LLM) meningkat dengan bilangan ejen instantiated. Kajian ini adalah yang pertama untuk mengesahkan kesejagatan fenomena ini dalam pelbagai senario, membandingkannya dengan kaedah kompleks lain, meneroka sebab di sebalik fenomena ini, dan mencadangkan kaedah untuk meneruskan kesan penskalaan.
paper Tajuk: Lebih banyak ejen adalah semua yang anda perlukan alamat kertas: https://arxiv.org/abs/2402.05120
Code Alamat: https://github.com/moreagentsisalis. /Lebih-Agen-Adalah-Anda-Perlu
Dalam artikel ini, penyelidik dari Tencent mendapati bahawa: hanya melalui kaedah pengundian pensampelan mudah, prestasi model bahasa besar akan meningkat dengan instantiasi ejen. Ia dipertingkatkan apabila bilangan bertambah, menunjukkan sifat penskalaan (kebolehskalaan) tanpa memerlukan rangka kerja kerjasama ejen multi-LLM yang kompleks dan kaedah kejuruteraan segera. Tambahan pula, kaedah ini adalah ortogonal kepada kaedah canggih sedia ada dan, apabila digabungkan, boleh meningkatkan lagi LLM ke tahap yang berkaitan dengan kesukaran tugasan. Kertas kerja ini melakukan kajian pertama mengenai sifat penskalaan ejen mentah (merujuk kepada ejen LLM yang tidak bergantung pada rangka kerja kejuruteraan segera dan kerjasama yang kompleks. Ia menjalankan eksperimen komprehensif pada pelbagai penanda aras LLM untuk mengesahkan kesejagatan penemuan ini strategi yang boleh memudahkan berlakunya. Kod itu kini menjadi sumber terbuka.


Tentukan keputusan akhir melalui undian majoriti



berasaskan LLAMA70B
berasaskan LLAMA70B
- Kesukaran intrinsik: Apabila kesukaran tugasan yang wujud meningkat, peningkatan prestasi (iaitu keuntungan prestasi relatif) juga akan meningkat, tetapi apabila kesukaran mencapai tahap tertentu, keuntungan akan beransur-ansur berkurangan. Ini menunjukkan bahawa apabila tugas itu terlalu kompleks, keupayaan penaakulan model mungkin tidak dapat bersaing, mengakibatkan kesan marginal peningkatan prestasi berkurangan.
- Bilangan langkah: Apabila bilangan langkah yang diperlukan untuk menyelesaikan tugas meningkat, begitu juga peningkatan prestasi. Ini menunjukkan bahawa dalam tugasan berbilang langkah, menambah bilangan ejen boleh membantu model mengendalikan setiap langkah dengan lebih baik, sekali gus meningkatkan prestasi penyelesaian tugas secara keseluruhan.

Berdasarkan perkara ini, kertas kerja mencadangkan dua strategi pengoptimuman untuk meningkatkan lagi keberkesanan kaedah:
- Selangkah demi selangkah Persampelan-dan-Memecahkan tugasan: Ini dan Pecahkan tugasan: gunakan pensampelan dan pengundian pada setiap langkah untuk mengurangkan ralat kumulatif dan meningkatkan prestasi keseluruhan.
Pensampelan-dan-Pengundian Hierarki: Kaedah ini menguraikan tugasan berkemungkinan rendah kepada berbilang subtugasan berkemungkinan tinggi dan menyelesaikannya secara hierarki Pada masa yang sama, model yang berbeza boleh digunakan untuk mengendalikan subtugasan dengan kebarangkalian yang berbeza untuk mengurangkan kos .
Atas ialah kandungan terperinci Kuantiti adalah kuasa! Tencent mendedahkan: Lebih banyak bilangan ejen, lebih baik kesan model bahasa besar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Memanfaatkan kuasa AI di peranti: Membina CLI Chatbot Peribadi Pada masa lalu, konsep pembantu AI peribadi kelihatan seperti fiksyen sains. Bayangkan Alex, seorang peminat teknologi, bermimpi seorang sahabat AI yang pintar, yang tidak bergantung

Pelancaran AI4MH mereka berlaku pada 15 April, 2025, dan Luminary Dr. Tom Insel, M.D., pakar psikiatri yang terkenal dan pakar neurosains, berkhidmat sebagai penceramah kick-off. Dr. Insel terkenal dengan kerja cemerlangnya dalam penyelidikan kesihatan mental dan techno

"Kami mahu memastikan bahawa WNBA kekal sebagai ruang di mana semua orang, pemain, peminat dan rakan kongsi korporat, berasa selamat, dihargai dan diberi kuasa," kata Engelbert, menangani apa yang telah menjadi salah satu cabaran sukan wanita yang paling merosakkan. Anno

Pengenalan Python cemerlang sebagai bahasa pengaturcaraan, terutamanya dalam sains data dan AI generatif. Manipulasi data yang cekap (penyimpanan, pengurusan, dan akses) adalah penting apabila berurusan dengan dataset yang besar. Kami pernah meliputi nombor dan st

Sebelum menyelam, kaveat penting: Prestasi AI adalah spesifik yang tidak ditentukan dan sangat digunakan. Dalam istilah yang lebih mudah, perbatuan anda mungkin berbeza -beza. Jangan ambil artikel ini (atau lain -lain) sebagai perkataan akhir -sebaliknya, uji model ini pada senario anda sendiri

Membina portfolio AI/ML yang menonjol: Panduan untuk Pemula dan Profesional Mewujudkan portfolio yang menarik adalah penting untuk mendapatkan peranan dalam kecerdasan buatan (AI) dan pembelajaran mesin (ML). Panduan ini memberi nasihat untuk membina portfolio

Hasilnya? Pembakaran, ketidakcekapan, dan jurang yang melebar antara pengesanan dan tindakan. Tak satu pun dari ini harus datang sebagai kejutan kepada sesiapa yang bekerja dalam keselamatan siber. Janji Agentic AI telah muncul sebagai titik perubahan yang berpotensi. Kelas baru ini

Impak segera berbanding perkongsian jangka panjang? Dua minggu yang lalu Openai melangkah ke hadapan dengan tawaran jangka pendek yang kuat, memberikan akses kepada pelajar A.S. dan Kanada.


Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SecLists
SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.

PhpStorm versi Mac
Alat pembangunan bersepadu PHP profesional terkini (2018.2.1).

Muat turun versi mac editor Atom
Editor sumber terbuka yang paling popular

ZendStudio 13.5.1 Mac
Persekitaran pembangunan bersepadu PHP yang berkuasa