Rumah >Peranti teknologi >AI >Versi sumber terbuka domestik 'Sistem pemalam ChatGPT' ada di sini! Douban, carian semuanya tersedia, dikeluarkan bersama oleh Universiti Tsinghua, Face Wall Intelligence, dsb.
Baru-baru ini, projek sumber terbuka yang dipanggil "Sistem Alternatif Domestik Plugin ChatGPT" mempunyai peningkatan mendadak dalam bintang di GitHub.
Projek ini ialah BMTools, enjin pembelajaran alat model besar yang dibangunkan oleh Wallface Intelligence.
Alamat projek: https://www.php.cn/link/a330f9fecc388ce67f87b09855480ca3
Sebagai platform pembelajaran alat boleh skala sumber terbuka berdasarkan model bahasa, pasukan R&D yang menghadap dinding telah menyatukan pelbagai proses panggilan alat ke dalam rangka kerja BMTools, menjadikan keseluruhan panggilan alat Penyeragaman proses dan automasi.Pada masa ini, pemalam yang disokong oleh BMTools meliputi aspek hiburan, akademik, kehidupan dan lain-lain, termasuk filem-douban (filem Douban), carian (carian Bing), Klarna (membeli-belah) , dsb.
Pembangun boleh menggunakan BMTools untuk menggunakan model tertentu (seperti ChatGPT, GPT-4) untuk memanggil pelbagai antara muka alat untuk melaksanakan fungsi tertentu.
Selain itu, kit alat BMTools juga telah menyepadukan Auto-GPT dan BabyAGI yang popular baru-baru ini.
Jadi, apakah yang dilakukan oleh pembelajaran alat ini untuk model besar?
Walaupun model besar telah mencapai hasil yang luar biasa dalam banyak aspek, masih terdapat batasan tertentu dalam tugasan dalam bidang tertentu. Tugasan ini selalunya memerlukan alat khusus atau pengetahuan domain untuk diselesaikan dengan berkesan.Oleh itu, sama seperti telefon pintar perlu memuat turun aplikasi untuk mendapatkan pengalaman pengguna yang lebih baik, model besar perlu mempunyai keupayaan untuk memanggil pelbagai alat profesional supaya mereka boleh memberikan penyelesaian yang lebih baik untuk real- tugas dunia untuk sokongan penuh.
Pembelajaran Alat, paradigma baharu model besar,
wujud. Di tengah-tengah paradigma ini ialah gabungan alat khusus dengan kekuatan model asas untuk mencapai ketepatan, kecekapan dan autonomi yang lebih tinggi dalam penyelesaian masalah.
Alamat kertas: https://arxiv.org/abs/2304.08354
Pada 23 Mac 2023, OpenAI mengumumkan pelancaran sistem pemalam (Pemalam Keupayaan pemalam ini ialah apa yang kami panggil pembelajaran alat). Dengan sokongan pembelajaran alat, Pemalam boleh menyokong ChatGPT untuk menyambungkan penyemak imbas, pengiraan matematik dan alatan luaran lain, meningkatkan keupayaannya.
Kemunculan Pemalam ChatGPT telah menambah kekurangan terakhir ChatGPT, membolehkannya menyokong rangkaian dan menyelesaikan pengiraan matematik Ia dipanggil momen "App Store" OpenAI. Walau bagaimanapun, sehingga kini, ia hanya disokong untuk pengguna OpenAI Plus dan kekal tidak tersedia kepada kebanyakan pembangun.
Mengapa Mianbi boleh melancarkan BMTools hanya sepuluh hari selepas keluaran Pemalam ChatGPT?
Wallface Intelligence telah menumpukan pada pembangunan alat pengkomputeran yang cekap untuk keseluruhan proses model besar Pasukan R&D telah meneruskan penyelidikan tentang paradigma baharu pembelajaran alatan sejak 2022, cuba menyepadukan model bahasa sedia ada Digabungkan dengan enjin carian, pangkalan pengetahuan dan alatan lain, hasil percubaan yang baik telah dicapai. Pasukan ini juga telah menjalankan penerokaan yang membuahkan hasil dalam bidang penyelidikan termaju pembelajaran alat.
Untuk memenuhi jangkaan ramai pembangun untuk keupayaan Pemalam OpenAI, berdasarkan pengumpulan sebelumnya, pasukan dengan pantas menggunakan hasil penyelidikan yang berkaitan dan menyusunnya ke dalam Pakej alat BMTools membenamkan pembelajaran alat ke dalam sistem keupayaan model besar pintar yang menghadap dinding dan secara rasmi menyertai sistem alat model besar OpenBMB "Family Bucket ".
Pembelajaran alat juga merupakan satu lagi karya agung yang dilancarkan oleh Wallface Intelligence selepas set latihan, penalaan halus, inferens dan mampatan yang cekap.
kit alat BTools: https : //www.php.cn/link/a330f9fecc388ce67f87b09855480ca3
Baru-baru ini , Wall-Facing Intelligence bekerjasama dengan penyelidik dari Universiti Tsinghua, Kongres Rakyat Kebangsaan dan Tencent untuk bersama-sama mengeluarkan WebCPM, rangka kerja model soalan dan jawapan sumber terbuka pertama berdasarkan carian web interaktif dalam bahasa Cina bidang Kerja perintis ini mengisi jurang antara model domestik yang besar Medan kosong. Dan WebCPM ialah amalan BMTools yang berjaya.
Pada masa ini, kerja berkaitan WebCPM telah diterima ke dalam ACL 2023, persidangan teratas mengenai pemprosesan bahasa semula jadi.
Pautan kertas WebCPM: https://arxiv.org/abs/2305.06849
Data WebCPM Pautan ke kod: https://github.com/thunlp/WebCPM
Boleh dikatakan sejak ChatGPT menjadi popular, model besar dari pelbagai puak di China telah muncul seperti cendawan selepas hujan, tetapi kebanyakan model tidak disambungkan ke Internet.
Model besar yang tidak disambungkan ke Internet tidak boleh mendapatkan maklumat terkini dan kandungan yang dijana adalah berdasarkan set data lama, yang mempunyai had tertentu.
Ciri WebCPM ialah pengambilan maklumatnya adalah berdasarkan carian web interaktif Ia boleh berinteraksi dengan enjin carian seperti manusia untuk mengumpul pengetahuan fakta yang diperlukan untuk menjawab soalan dan menjana jawapan. .
Dalam erti kata lain, dengan sokongan fungsi Internet, masa nyata dan ketepatan menjawab soalan model besar telah dipertingkatkan.
Rangka Kerja Model WebCPM
WebCPM menyasarkan WebGPT, yang juga merupakan teknologi carian generasi baharu di sebalik Bing Baharu Microsoft yang dilancarkan baru-baru ini.
Seperti WebGPT, WebCPMmengatasi kelemahan paradigma soalan dan jawapan terbuka teks panjang LFQA (Long-form Question Answering) tradisional: bergantung pada pencarian bukan interaktif kaedah, yang mendapatkan maklumat hanya menggunakan soalan asal sebagai pernyataan pertanyaan.
Di bawah rangka kerja WebCPM, model ini boleh menapis maklumat berkualiti tinggi dengan berinteraksi dengan enjin carian dalam masa nyata untuk menjalankan carian web seperti manusia.
Bukan itu sahaja, apabila menghadapi masalah yang kompleks, model itu juga memecahkannya kepada beberapa sub-masalah seperti manusia dan bertanya soalan mengikut urutan.
Selain itu, dengan mengenal pasti dan menyemak imbas maklumat yang berkaitan, model akan secara beransur-ansur meningkatkan pemahamannya tentang masalah asal dan terus bertanya soalan baharu untuk mencari maklumat yang lebih pelbagai.
Antara muka interaktif carian CPM Web
Masa Depan , Kepintaran menghadap ke dinding juga akan menggalakkan lagi aplikasi dan transformasi hasil penyelidikan saintifik ini, dan berusaha untuk mempromosikan pelaksanaan model besar WebCPM dalam bidang yang sepadan.
Wall-face Intelligence sentiasa berusaha untuk menerajui inovasi asal yang besar model dan komited untuk membina infrastruktur dan penciptaan model besar dalam era pintar Sistem model besar domestik, dengan tujuan akhirnya merealisasikan "membiarkan model besar terbang ke beribu-ribu isi rumah".
Hasil kepintaran menghadap dinding jelas kepada semua dan telah diiktiraf oleh industri.
Li Dahai, ketua pegawai teknologi Zhihu, pernah mengulas mengenai perisikan yang menghadap ke dinding: "Pasukan perisikan yang menghadap dinding ialah pasukan pertama di China yang menjalankan secara besar-besaran. Penyelidikan model bahasa. Syarikat itu menyimpan penyelidikan dan aplikasi model yang besar Dengan keupayaan teknikal penuhnya, termasuk teknologi penalaan halus dan teknologi pecutan, keupayaan R&Dnya berada di kedudukan utama dalam industri itu." menghadapi Perisikan boleh berkembang menjadi penyedia teras infrastruktur dalam bidang model berskala besar China dan menyumbang kepada industri model berskala besar China.
Panorama pintar menghadap dinding
Bergantung pada platform Alat dan perpustakaan model besar, syarikat itu melancarkan Sistem model besar ModelForce dan model besar peringkat perusahaan CPM . ModelForce, platform produktiviti AI berdasarkan model besar, mempunyai sistem alat pengkomputeran yang cekap terbina dalam untuk keseluruhan proses latihan model besar, penalaan halus, pemampatan dan inferens.
Platform ini berdasarkan keupayaan umum model besar dengan sampel yang sedikit dan sampel sifar Ia menggunakan kaedah penalaan halus terstandard model besar dan mencipta pelanggan penalaan halus kod sifar boleh mengurangkan dengan ketara kos anotasi data dalam proses R&D AI dan kos tenaga kerja.
CPM Large Model Enterprise Edition telah meningkatkan keupayaannya untuk model versi sumber terbuka, dan mempunyai ciri-ciri penyepaduan berbilang keupayaan, penalaan halus tambahan dan penyesuaian fleksibel serta pelbagai senario permohonan.
Berdasarkan model besar peringkat perusahaan CPM dan sistem model besar ModelForce, Wallface Intelligence bekerjasama dengan Zhihu untuk melatih model besar "Zhihaitu AI" .
Model besar "Zhihaitu AI" telah digunakan pada senarai hangat Zhihu, yang boleh mengekstrak elemen dengan cepat, menyusun pendapat dan kandungan agregat Ia dibentangkan pada Persidangan Penemuan Zhihu pada April 23 keluaran.
Ia tidak berhenti di situ sahaja. Malah, Wall-Facing Intelligence berdiri tinggi dan telah berjaya mencipta corak ekologi industri-universiti-penyelidikan model besar "Trinity" Dengan menyepadukan kuasa penyelidikan akademik universiti terkemuka dan terus membina dan mengendalikan komuniti sumber terbuka model berskala besar OpenBMB, binaan Kecerdasan Menghadapi Dinding Buat saluran gelung tertutup antara permintaan industri, algoritma sumber terbuka dan pelaksanaan industri, dan berusaha untuk mempromosikan penyelidikan termaju, penyelidikan dan pembangunan aplikasi dan pembangunan industri dalam bidang model besar domestik.
Untuk menyumbang kepada pembinaan ekosistem sumber terbuka model besar domestik, kami telah mengeluarkan satu siri kit sumber terbuka proses penuh model besar termasuk OpenPrompt, OpenDelta, BInf, BMCook, BMTrain, BMTools, dsb., dan melancarkan mereka di Zhihu, Bilibili dan platform lain Kelas terbuka model besar untuk semua.
Sebagai penyelidikan institut di universiti Kekuatan penyelidikan Yiqi Juechen telah ditubuhkan pada tahun 1970-an Ia adalah unit penyelidikan saintifik yang paling awal dan paling berpengaruh di China untuk menjalankan penyelidikan NLP Ia mempunyai ramai sarjana dan saintis terkenal yang bekerja di dalamnya, dan kerja penyelidikannya dalam bidang model bahasa besar sangat cemerlang.
Didedikasikan untuk aplikasi model besar dalam senario biasa dan bidang kecerdasan buatan Aplikasi dan pelaksanaan, model besar CPM ialah model besar bahasa pra-latihan yang dibangunkan sendiri oleh pasukan Wallface berdasarkan pengalaman latihan model besar selama bertahun-tahun. Syarikat itu pada masa ini telah menyelesaikan berpuluh-puluh juta yuan dalam pembiayaan pusingan malaikat, dan banyak institusi terkenal telah mencapai kerjasama strategik dengan syarikat itu.
Dalam perjalanan berusaha untuk membina sistem model besar domestik, visi perisikan yang menghadap dinding sentiasa untuk membolehkan pelaksanaan besar model untuk memperkasakan lebih banyak industri dan memberi manfaat kepada lebih ramai syarikat dan individu.
Percikan api telah mencetuskan kebakaran padang rumput Kami menantikan model besar yang mengeluarkan potensi mereka dalam lebih banyak bidang dan menunjukkan nilai aplikasi yang mengejutkan.
Atas ialah kandungan terperinci Versi sumber terbuka domestik 'Sistem pemalam ChatGPT' ada di sini! Douban, carian semuanya tersedia, dikeluarkan bersama oleh Universiti Tsinghua, Face Wall Intelligence, dsb.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!