Rumah > Artikel > Peranti teknologi > Zhipu AI melancarkan model asas besar generasi ketiga ChatGLM3 dengan pencapaian menyeluruh dalam prestasi
Pada 27 Oktober 2023, Zhipu AI melancarkan model asas generasi ketiga ChatGLM3 yang dibangunkan sendiri sepenuhnya dan siri produk berkaitan pada Persidangan Komputer China (CNCC) 2023 Satu lagi kejayaan besar selepas model dialog Blok ChatGLM dan ChatGLM2. ChatGLM3 yang dilancarkan kali ini menggunakan kaedah pra-latihan dipertingkatkan pelbagai peringkat asal untuk menjadikan latihan lebih lengkap. Penilaian menunjukkan bahawa dalam 44 ujian set data awam Cina dan Inggeris, ChatGLM3 menduduki tempat pertama dalam kalangan model domestik dengan saiz yang sama. Zhang Peng, Ketua Pegawai Eksekutif Zhipu AI, melancarkan produk baharu di tapak dan menunjukkan ciri produk terkini dalam masa nyata.
ChatGLM3 peningkatan teknologi baharu dengan prestasi yang lebih tinggi dan kos yang lebih rendah
Dengan data latihan yang lebih kaya dan penyelesaian latihan yang lebih baik, prestasi ChatGLM3 yang dilancarkan oleh Zhipu AI adalah lebih hebat. Berbanding dengan ChatGLM2, MMLU meningkat sebanyak 36%, CEval meningkat sebanyak 33%, GSM8K meningkat sebanyak 179%, dan BBH meningkat sebanyak 126%.
Pada masa yang sama, ChatGLM3 menyasarkan GPT-4V dan telah melaksanakan peningkatan berulang beberapa fungsi baharu, termasuk CogVLM dengan keupayaan pemahaman pelbagai mod - semantik pengecaman imej, yang telah mencapai SOTA pada lebih daripada 10 set data penilaian grafik standard antarabangsa; kod Modul yang dipertingkatkan Jurubahasa Kod menjana kod dan melaksanakannya mengikut keperluan pengguna, secara automatik menyelesaikan tugas yang kompleks seperti analisis data dan pemprosesan fail peningkatan carian rangkaian WebGLM-peningkatan carian akses secara automatik boleh mencari maklumat yang berkaitan di Internet berdasarkan soalan dan menyediakan rujukan yang relevan semasa menjawab Sastera atau pautan artikel. Keupayaan semantik dan logik ChatGLM3 telah dipertingkatkan.
ChatGLM3 juga menyepadukan teknologi AgentTuning yang dibangunkan sendiri, yang mengaktifkan keupayaan ejen model, terutamanya dari segi perancangan dan pelaksanaan pintar, yang 1000% bertambah baik berbanding ChatGLM2 ia juga membolehkan model besar domestik menyokong panggilan alat, pelaksanaan kod secara asli , permainan, operasi pangkalan data, carian dan penaakulan graf pengetahuan, sistem pengendalian dan senario kompleks lain.
Selain itu, ChatGLM3 kali ini melancarkan model ujian akhir ChatGLM3-1.5B dan ChatGLM3-3B yang boleh digunakan pada telefon mudah alih Mereka menyokong pelbagai telefon mudah alih dan platform yang dipasang pada kenderaan termasuk vivo, Xiaomi dan Samsung, dan juga menyokong inferens cip CPU pada platform mudah alih Kelajuan boleh mencapai 20 token/s. Dari segi ketepatan, prestasi model 1.5B dan 3B adalah hampir dengan model ChatGLM2-6B pada penanda aras awam.
Berdasarkan inferens dinamik terkini dan teknologi pengoptimuman memori, rangka kerja inferens semasa ChatGLM3 di bawah keadaan perkakasan dan model yang sama, berbanding dengan pelaksanaan sumber terbuka terbaik semasa, termasuk vLLM yang dilancarkan oleh University of Berkeley dan versi terkini Hugging Hadapi TGI, inferens Kelajuan meningkat sebanyak 2-3 kali ganda, dan kos inferens digandakan Ia hanya 0.5 mata setiap seribu token, yang merupakan kos terendah.
Generasi baharu "Zhipu Qingyan" dilancarkan, keupayaan interaksi kod pertama di China
Dikuasakan oleh ChatGLM3 yang baru dinaik taraf, pembantu AI generatif Zhipu Qingyan telah menjadi produk model besar pertama (Code Interpreter) di China dengan keupayaan interaksi kod (https://chatglm.cn/main/code).
Fungsi "kod" kini menyokong pemprosesan imej, pengiraan matematik, analisis data dan senario penggunaan lain. Berikut adalah:
§ Memproses data untuk menjana carta
§ Kod untuk melukis grafik
§ Muat naik analisis kod SQL
Dengan penambahan keupayaan model besar WebGLM, Zhipu Qingyan juga mempunyai keupayaan peningkatan carian, yang boleh membantu pengguna menyusun kesusasteraan dalam talian atau pautan artikel untuk soalan berkaitan dan memberikan jawapan secara langsung.
Model CogVLM yang dikeluarkan sebelum ini telah meningkatkan keupayaan pemahaman imej dan teks bahasa Cina Zhipu Qingyan dan mencapai keupayaan pemahaman imej hampir dengan GPT-4V Ia boleh menjawab pelbagai jenis soalan visual dan melengkapkan pengesanan sasaran yang kompleks dan melabelkannya untuk melengkapkan anotasi data automatik.
Sejak awal tahun 2022, model siri GLM yang dilancarkan oleh Zhipu AI telah menyokong pra-latihan dan inferens berskala besar pada seni bina Ascend, Sunway Supercomputing dan Haiguang DCU. Sehingga kini, produk Zhipu AI telah menyokong lebih daripada 10 ekosistem perkakasan domestik, termasuk Ascend, Sunway Supercomputer, Haiguang DCU, Haifeike, Muxixiyun, Teknologi Pengkomputeran, Tianshu Intelligent Core, Cambrian dan Moore Thread , Baidu Kunlun Core, Lingxi Technology, Great Wall Chaoyun, dsb. Melalui inovasi bersama dengan syarikat cip domestik, pengoptimuman prestasi berterusan akan membantu model besar asli tempatan dan cip domestik memasuki peringkat antarabangsa secepat mungkin.
ChatGLM3 dan siri produk berkaitan yang dilancarkan oleh Zhipu AI telah meningkatkan prestasi modelnya secara menyeluruh, mencipta ekosistem sumber terbuka yang lebih terbuka untuk industri, dan seterusnya menurunkan ambang untuk pengguna biasa menggunakan produk AIGC. AI membawa kita ke era baharu, dan model besar pasti akan mempercepatkan ketibaan saat ini.
Atas ialah kandungan terperinci Zhipu AI melancarkan model asas besar generasi ketiga ChatGLM3 dengan pencapaian menyeluruh dalam prestasi. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!