Rumah >Peranti teknologi >AI >Kuaishou mempunyai sistem, model dan data Agen sumber terbuka!

Kuaishou mempunyai sistem, model dan data Agen sumber terbuka!

WBOY
WBOYke hadapan
2024-01-09 11:25:571130semak imbas

Bolehkah model bersaiz 7B juga bermain dengan Ejen AI? Baru-baru ini, "KwaiAgents" sumber terbuka Kuaishou. Ia bukan sahaja akan membantu anda mencari tempat, tetapi juga mempertimbangkan cuaca untuk anda pada hari itu.

Kuaishou mempunyai sistem, model dan data Agen sumber terbuka!

Seperti yang kita ketahui, model bahasa besar (LLM) menguasai sejumlah besar pengetahuan melalui bahasa pemodelan dan mempunyai keupayaan kognitif dan penaakulan tertentu. Walau bagaimanapun, walaupun GPT-4 yang paling berkuasa pada masa ini menghasilkan kandungan palsu apabila digunakan secara bersendirian dan tidak boleh berinteraksi dengan dunia dalam masa nyata. Ejen AI ialah satu cara untuk menyelesaikan masalah ini Dengan merangsang keupayaan model besar untuk merancang tugas, mencerminkan dan memanggil alat, model besar boleh menggunakan alat dunia sebenar untuk meningkatkan ketepatan kandungan yang dijana malah mempunyai keupayaan untuk menyelesaikan kompleks. masalah. Kali ini, "KwaiAgents" yang dibangunkan bersama oleh Kuaishou dan Institut Teknologi Harbin membolehkan model besar "kecil" 7B/13B mengatasi kesan GPT-3.5, dan sistem, model, data dan penilaian ini semuanya adalah sumber terbuka!

Kuaishou mempunyai sistem, model dan data Agen sumber terbuka!

Kuaishou mempunyai sistem, model dan data Agen sumber terbuka!


  • Laporan teknikal: https://arxiv.org/abs/2312.04889 homepage
  • /KwaiK EG/KwaiAgents
Kandungan berikut boleh didapati di laman utama Github "KwaiAgents":

    System (KAgentSys-Lite): sistem Agen AI yang ringan, dilengkapi dengan alat berfakta dan tepat pada masanya;🜎 (KAgentLMs): Selepas Meta-Agent Tuning, satu siri model besar dengan keupayaan biasa Ejen dan data latihan mereka
  1. Evaluation (KAgentBench): Out-of-the-box Keupayaan Ejen penilaian automatik Penanda aras dan hasil penilaian manual .

Sistem Kuaishou mempunyai sistem, model dan data Agen sumber terbuka!

Komponen utama sistem KAgentSys termasuk teras kognitif, mekanisme memori dan perpustakaan alat berdasarkan model besar untuk mencapai mekanisme berulang

termasuk Mekanisme berulang tiga jenis ingatan, pangkalan pengetahuan, dialog dan sejarah tugas, bergantung pada rangka kerja pengambilan semula vektor hibrid, perolehan kata kunci dan teknologi lain untuk mendapatkan maklumat yang diperlukan dalam setiap laluan yang dirancang.

Set alat: Mengandungi set alat yang dipertingkatkan fakta Mekanisme carian dan penyemakan imbas heterogen boleh mengumpulkan pengetahuan daripada pelbagai sumber seperti halaman web, ensiklopedia teks dan ensiklopedia video termasuk kalendar, cuti, perbezaan masa, cuaca dan lain-lain ketepatan masa biasa Set alat yang dipertingkatkan.

  1. Gelung Automatik: Dalam satu pusingan dialog, pengguna akan diberikan soalan, pangkalan pengetahuan pilihan dan aksara tambahan untuk input secara keseluruhan Sistem akan mula-mula mengemas kini dan mendapatkan semula memori, dan kemudian memanggil model besar untuk Perancangan tugasan. Jika alat itu perlu dipanggil, ia akan dipanggil Jika ia tidak digunakan, ia akan memasuki peringkat ringkasan Model besar akan mensintesis maklumat sejarah dan memberikan jawapan yang diharapkan. . cadangan pasukan Meta-Agent Kaedah Tuning (MAT) meningkatkan fleksibiliti model besar dari segi keupayaan Ejen dan menambah baik kesannya dengan memperkenalkan lebih banyak templat Agent Prompt ke dalam data latihan.
  2. Meta-Agent Tuning (MAT) dibahagikan kepada dua peringkat:
  1. Peringkat penjanaan templat: Dengan mereka bentuk Meta-Agent, untuk set masalah tertentu, hasilkan templat Agent Prompt yang disegerakan (gambar di sebelah kanan ialah contoh) calon dan dalam persekitaran percubaan yang sama, jana keputusan calon yang dihasilkan oleh templat , dan hasil berkeyakinan tinggi yang dihasilkan oleh templat sumber terbuka (seperti ReAct, AutoGPT, dll.) dibandingkan dan dijaringkan menggunakan model pemarkahan untuk menyaring perpustakaan templat Agent Prompt berkualiti tinggi. Dengan memperkenalkan templat yang pelbagai ini, pergantungan pada templat semasa penalaan halus model boleh dikurangkan dengan ketara, dan keupayaan Ejen yang lebih penting dalam perancangan tugas, penggunaan alat, refleksi, dsb. boleh diperhalusi, dengan itu meningkatkan generalisasi dan keberkesanan model .
  2. Fasa penalaan halus arahan: Berdasarkan puluhan ribu templat, lebih daripada 200,000 data penalaan halus arahan penalaan Ejen telah dibina. Pasukan ini telah menala beberapa model sumber terbuka yang popular seperti Qwen-7B, Baichuan2-13B, dsb. untuk kegunaan dan rujukan semua orang, dan model popular lain akan dikeluarkan pada masa hadapan.

Evaluation

KAgentBench telah mencapai penggunaan luar biasa melalui beribu-ribu data beranotasi yang diperhalusi secara manual, membolehkan semua orang menggunakan satu baris perintah untuk menilai pelbagai aspek keupayaan Ejen model besar di bawah templat yang berbeza.

Kuaishou mempunyai sistem, model dan data Agen sumber terbuka!

Di KAgentBench, seperti yang ditunjukkan dalam rajah di atas, kami akan menjalankan pembinaan input untuk pelbagai jenis kebolehan. Setiap pertanyaan disertakan dengan berbilang templat dan berbilang jawapan sebenar yang diedit manusia. Tujuannya adalah untuk menilai secara menyeluruh ketepatan dan generalisasi. Selepas penalaan MAT, jadual di bawah menunjukkan penambahbaikan model 7B-13B dalam pelbagai keupayaan, dan melebihi kesan GPT-3.5

Kuaishou mempunyai sistem, model dan data Agen sumber terbuka!

Kajian itu juga menjalankan penilaian silang, menjemput anotasi manusia kepada 200 fakta dan soalan sensitif masa diberi anotasi, seperti "Berapa umur Andy Lau tahun ini?" Keputusan menunjukkan bahawa model selepas sistem KAgentSys dan MAT bertambah baik dengan ketara (ketepatan dinyatakan dalam peratusan, dan skor purata pada skala 5 mata adalah dalam kurungan)

Kuaishou mempunyai sistem, model dan data Agen sumber terbuka!

Kuaishou mempunyai sistem, model dan data Agen sumber terbuka!

-masalah ekor dan masalah popular , biasanya hasil yang bergantung semata-mata pada carian web adalah tidak ideal. Sebagai contoh, jika anda bertanya soalan panjang seperti "Berapa hari Antonella lebih tua daripada Messi?", hasil carian biasanya akan mengembalikan beberapa gosip tentang mereka tanpa memberikan maklumat penting. KAgentSys boleh menjawab soalan ini dengan tepat dengan menghubungi alat carian ensiklopedia untuk mendapatkan tarikh lahir yang tepat, dan kemudian menggunakan alat perbezaan masa untuk mengira perbezaan umur Pasukan itu berkata bahawa Ejen AI adalah laluan yang sangat menjanjikan. Pada masa hadapan, kami akan terus mengumpul teknologi teras dan terus menyuntik tenaga baharu ke dalam seluruh komuniti. Pada masa yang sama, kami juga akan meneroka secara aktif gabungan teknologi Agen dan perniagaan Kuaishou, dan cuba melaksanakan aplikasi inovatif yang lebih menarik dan bernilai

Atas ialah kandungan terperinci Kuaishou mempunyai sistem, model dan data Agen sumber terbuka!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam