Rumah >Peranti teknologi >AI >Versi sumber terbuka GLM-4 akhirnya di sini: mengatasi Llama3, pelbagai mod setanding dengan GPT4V, dan platform MaaS juga telah dinaik taraf dengan banyak.
Versi terbaru model besar, 6 sen dan 1 juta Token.
Pagi ini, pada Hari Terbuka AI, syarikat model besar yang mendapat perhatian ramai Zhipu AI mengumumkan satu siri angka pelaksanaan industri:
Menurut statistik terkini, Zhipu AI model besar ialah open Platform pada masa ini mempunyai 300,000 pengguna berdaftar, dan purata volum panggilan harian telah mencapai 40 bilion Token Antaranya, penggunaan API harian telah meningkat lebih daripada 50 kali ganda dalam tempoh 6 bulan yang lalu, dan model GLM-4 yang paling berkuasa. telah meningkat dalam tempoh 4 bulan yang lalu Terdapat lebih daripada 90 kali ganda pertumbuhan.
Dalam Apl Qingtan baru-baru ini, lebih 300,000 ejen telah aktif dalam pusat ejen, termasuk banyak alat produktiviti yang sangat baik, seperti peta minda, pembantu dokumen, penjadual dan banyak lagi.
Dari segi teknologi baharu, versi terkini GLM-4, GLM-4-9B, mengatasi Llama 3 8B dalam semua aspek Model berbilang modal GLM-4V-9B juga dalam talian, dan semua model besar kekal terbuka sumber.
Satu siri pencapaian komersial dan penemuan teknologi sangat menarik perhatian.
Naik taraf platform MaaS kepada versi 2.0
Meletakkan ambang untuk aplikasi model besar
Baru-baru ini, model besar domestik memulakan pusingan baharu persaingan.
Pada awal Mei, Zhipu AI menerajui dalam mengurangkan harga perkhidmatan model besar GLM-3-Turbo kepada 1/5 daripada harga asal, yang turut memberi inspirasi kepada ramai pemain dalam bidang model besar untuk "menyertai perang. " Daripada tergesa-gesa untuk menubuhkan syarikat permulaan, "Pertempuran 100 Model" kepada perang harga, persaingan dalam industri model besar telah meningkat ke atas.
Mengurangkan kos perkhidmatan model besar boleh membolehkan lebih banyak perusahaan dan pembangun memperoleh teknologi baharu, sekali gus menjana penggunaan yang mencukupi Ini bukan sahaja akan mempercepatkan kejayaan teknologi, tetapi juga membolehkan model besar menembusi dengan cepat ke dalam semua lapisan masyarakat susun atur komersial.
Perlu disebut bahawa pada masa ini, harga model besar telah ditolak dengan sangat rendah, tetapi Zhipu berkata bahawa ia tidak takut perang harga.
"Saya percaya bahawa semua orang menyedari perang harga model besar baru-baru ini, dan juga sangat mengambil berat tentang strategi pengkomersilan Zhipu. Kami berbangga untuk mengatakan bahawa kami telah mencapai aplikasi melalui lelaran teknologi teras model dan peningkatan kecekapan, dan melalui inovasi teknologi Pengurangan kos yang berterusan juga memastikan peningkatan berterusan nilai pelanggan," kata Zhang Peng, Ketua Pegawai Eksekutif Zhipu AI.
Mengikut skala aplikasi perusahaan yang berbeza, Zhipu telah mengumumkan satu siri pelarasan harga terkini. Diskaun API maksimum mencapai potongan 40%, dan versi GLM-4-9B boleh digunakan untuk hanya 6 sen / 1 juta token. Mengimbas kembali pada awal tahun lalu, harga model besar siri GLM telah dikurangkan sebanyak 10,000 kali ganda.
Sebagai permulaan pertama yang melabur dalam AI generatif, kelajuan pengkomersilan Zhipu AI lebih pantas berbanding kebanyakan pesaing. Bina matriks produk berdasarkan ratusan bilion model pra-latihan berbilang modal. Ia telah melancarkan alat penyesuaian ejen diperibadikan GLM untuk sisi C, membolehkan pengguna mencipta ejen GLM mereka sendiri dengan arahan perkataan segera yang mudah tanpa pengetahuan pengaturcaraan. Untuk pelanggan akhir perniagaan, generasi terbaru model besar GLM-4 telah dilancarkan pada platform MaaS (Model sebagai Perkhidmatan), menyediakan akses API.平 平
platform terbuka AI.
Pada Hari Terbuka hari ini, Zhipu melancarkan platform terbuka MaaS 2.0, yang telah mencapai peningkatan dalam model baharu, kos, keselamatan dan aspek lain.
Pada acara itu, Zhipu AI memperkenalkan kemajuan terkini platform terbukanya. Platform penalaan halus model yang dinaik taraf boleh membantu perusahaan memudahkan proses membina model persendirian. Seluruh rangkaian model besar GLM-4 kini menyokong penggunaan dalam tiga langkah sahaja.
Untuk pelaksanaan teknologi, alat model hanyalah satu langkah kecil. Ketua Pegawai Eksekutif Zhipu Zhang Peng sentiasa percaya bahawa terdapat tiga lapisan model dalam model besar, iaitu L0 (model asas), L1 (model industri) dan L2 (model inferens untuk senario bersegmen). Ini adalah perhubungan yang progresif. Apa yang perlu dilakukan oleh Zhipu ialah melakukan yang terbaik untuk melakukan L0, dan kemudian membantu rakan kongsinya untuk melakukan L1 dan L2.
Laluan pengkomersialan Zhipu AI adalah berdasarkan platform MaaS Ia menyediakan penyelesaian yang berbeza seperti cloud API, penswastaan awan, penswastaan tempatan, perisian dan mesin bersepadu perkakasan, dll. untuk kumpulan pelanggan yang berbeza dan keperluan untuk memenuhi keperluan perusahaan pada masa yang sama, ia juga menyedari skala "model dan perkhidmatan".
GLM-4 9B secara menyeluruh mengatasi Llama3
pariti berbilang modal dengan GPT-4V, sumber terbuka dan percuma
Untuk Zhipu AI, yang menganggap membina AGI sebagai matlamatnya, lelaran berterusan keupayaan teknikal model besar juga menjadi keutamaan.
Sejak model besar all In pada tahun 2020, Zhipu telah berada di barisan hadapan dalam gelombang kecerdasan buatan. Penyelidikannya melibatkan semua aspek teknologi model besar, daripada rangka kerja pra-latihan asal GLM, penyesuaian kuasa pengkomputeran domestik, model besar asas umum, kepada penaakulan semantik, penjanaan pelbagai mod, kepada konteks panjang, pemahaman visual dan keupayaan kecerdasan Ejen. Dalam semua aspek, Zhipu telah melaburkan banyak sumber untuk mempromosikan inovasi asli dalam teknologi.
Pada tahun lalu, Zhipu telah melancarkan empat generasi model besar tujuan umum: ChatGLM pada Mac 2023, ChatGLM2 pada bulan Jun dan ChatGLM3 pada bulan Oktober tahun lalu, model besar asas generasi terbaharu GLM-4 Dikeluarkan secara rasmi. Pada Hari Terbuka, Zhipu AI memperkenalkan kepada dunia luar pencapaian sumber terbuka terkini bagi model asas besar GLM-4 - GLM-4-9B.
Ia ialah versi sumber terbuka siri model pra-latihan generasi terkini GLM-4. GLM-4-9B mempunyai keupayaan asas yang lebih kukuh, konteks yang lebih panjang, melaksanakan panggilan fungsi yang lebih tepat dan keupayaan Semua Alat, dan mempunyai keupayaan berbilang modal untuk kali pertama.
Berdasarkan asas pra-latihan yang berkuasa, prestasi komprehensif GLM-4-9B dalam bahasa Cina dan Inggeris telah dipertingkatkan sebanyak 40% berbanding ChatGLM3-6B Ia mempunyai prestasi cemerlang dalam data penanda aras seperti keupayaan penjajaran bahasa Cina, AlignBench. pematuhan arahan IFeval, dan kod kejuruteraan Bangku Kod Semulajadi Peningkatan yang sangat ketara telah dicapai. Berbanding dengan Llama 3 8B, yang mempunyai jumlah latihan yang lebih besar, ia tidak kalah dengannya dalam Bahasa Inggeris dan telah meningkat sehingga 50% dalam mata pelajaran Bahasa Cina.
Panjang konteks model baharu telah dilanjutkan daripada 128K kepada 1M, yang bermaksud model itu boleh mengendalikan 2 juta perkataan input pada masa yang sama, yang bersamaan dengan dua buku Dream of Red Mansions atau 125 kertas. Pada LongBench-Chat dengan panjang 128K, model GLM-4-9B-Chat bertambah baik sebanyak 20% berbanding generasi sebelumnya. Dalam ujian jarum dalam tumpukan jerami dengan panjang 1M, GLM-4-9B-Chat-1M juga mencapai keputusan yang baik untuk semua hijau.
Generasi baharu model besar turut meningkatkan sokongan untuk berbilang bahasa. Perbendaharaan kata model telah dinaik taraf daripada 60,000 kepada 150,000, dan kecekapan pengekodan bahasa selain bahasa Cina dan Inggeris telah meningkat sebanyak purata 30%, yang bermaksud model itu boleh mengendalikan tugas dalam bahasa kecil dengan lebih cepat. Penilaian menunjukkan bahawa keupayaan berbilang bahasa model ChatGLM-4-9B secara menyeluruh melebihi Llama-3 8B.
Sambil menyokong operasi tempatan kad grafik gred pengguna, GLM-4-9B bukan sahaja menunjukkan keupayaan dialog yang berkuasa, menyokong 1 juta teks panjang dan merangkumi pelbagai bahasa, Lebih penting lagi: model besar yang dikeluarkan oleh Zhipu adalah Percuma dan sumber terbuka . Kini, setiap pembangun boleh menjalankan versi model GLM-4 ini secara tempatan.
Pautan GitHub: https://github.com/THUDM/GLM-4
Model: huggingface: https://huggingface.co/collections/THUDM/glm-4-665fcf188c414b03c2f7e3b7
Komuniti: https://Magic//modelscope.cn/organization/ZhipuAI
Selain model teks yang berkuasa, Zhipu AI juga sumber terbuka model berbilang mod GLM-4V-9B berdasarkan GLM-4-9B. Dengan menambahkan Pengubah Penglihatan, model ini mencapai keupayaan yang setanding dengan GPT-4V dengan hanya parameter 13B.
Sementara teknologi berkembang, harga model besar juga sentiasa menurun. Zhipu telah melancarkan model GLM-4-AIR, yang pada asasnya mengekalkan prestasi model besar GLM-4 pada bulan Januari dan telah mengurangkan harganya dengan ketara kepada 1 yuan/juta token.
Prestasi GLM-4-Air adalah setanding dengan model besar GLM-4-0116, dan harganya hanya 1/100 daripada yang terakhir. Perlu dinyatakan bahawa API GLM-4-Air telah meningkatkan kelajuan inferens dengan ketara Berbanding dengan GLM-4-0116, kelajuan inferens GLM-4-Air telah meningkat sebanyak 200%, dan ia boleh mengeluarkan 71 token. sesaat, yang jauh lebih tinggi daripada GLM-4-0116 Lebih cepat daripada kelajuan membaca mata manusia.
Zhipu menyatakan bahawa pelarasan harga untuk model besar adalah berdasarkan hasil penerokaan teknologi yang komprehensif, peningkatan kecekapan kuasa pengkomputeran dan kawalan kos akan diselaraskan pada selang masa yang tetap pada masa hadapan untuk memenuhi keperluan pembangun dan pelanggan dengan lebih baik. harga yang sangat kompetitif bukan sahaja berpatutan, tetapi juga selaras dengan strategi perniagaannya sendiri.
Pembinaan ekologi telah memasuki tahap seterusnya
Sebagai salah satu syarikat permulaan domestik pertama yang memasuki trek model besar, Zhipu AI kini telah menjadi wakil syarikat teknologi AI domestik.
Ia bukan sahaja peneraju dalam teknologi model besar domestik, tetapi juga kuasa China yang tidak boleh diabaikan dalam akademi model besar dan ekosistem sumber terbuka. Zhipu mempunyai pengaruh yang luas dalam bidang AI, dengan muat turun kumulatif model sumber terbuka mencapai 16 juta kali Menyokong komuniti sumber terbuka adalah komitmen Zhipu yang tidak berbelah bahagi.
Selain itu, Zhipu AI juga bersama-sama membangunkan piawaian keselamatan AI untuk model besar. Pada 22 Mei, syarikat dari negara dan wilayah yang berbeza, termasuk OpenAI, Google, Microsoft dan Zhipu AI, bersama-sama menandatangani Komitmen Keselamatan Frontier AI. Ia menunjukkan bahawa adalah perlu untuk memastikan struktur tadbir urus yang bertanggungjawab dan ketelusan untuk keselamatan kecerdasan buatan yang canggih, menerangkan secara bertanggungjawab cara mengukur risiko model kecerdasan buatan yang canggih, dan mewujudkan proses yang jelas untuk mekanisme pengurangan risiko untuk model keselamatan kecerdasan buatan yang canggih.
Di luar bidang AI, bagi banyak industri yang telah mendapat manfaat daripada penemuan model besar, Zhipu AI memacu perubahan produktiviti perusahaan melalui MaaS, dan ekosistem model besarnya telah mula terbentuk.
"Mengapa kita menilai bahawa 2024 adalah tahun pertama AGI? Jika anda boleh menjawab soalan ini dalam satu ayat: Undang-undang Penskalaan tidak gagal, dan pertumbuhan teknologi AI telah memasuki peringkat baru. Inovasi teknologi model besar masih maju dengan pesat, malah terdapat tanda-tanda semakin pantas," kata Zhang Peng. "Terus terang, kami tidak pernah melihat teknologi yang dinaik taraf secara berulang dengan keluk inovasi yang begitu curam dalam sejarah, dan ia bertahan untuk jangka masa yang begitu lama
Kepantasan inovasi teknologi dan pelaksanaan komersil Zhipu sedang mempraktikkan keluk Curam ini.
Dalam proses pembangunan teknologi, Zhipu AI telah berada di landasan pantas.
Atas ialah kandungan terperinci Versi sumber terbuka GLM-4 akhirnya di sini: mengatasi Llama3, pelbagai mod setanding dengan GPT4V, dan platform MaaS juga telah dinaik taraf dengan banyak.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!