Rumah >Peranti teknologi >AI >Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat
Mistral-Medium terbocor secara tidak sengaja? Sebelum ini hanya tersedia melalui API, prestasi hampir dengan GPT-4.
Kenyataan terbaru CEO: Memang benar, ia telah dibocorkan oleh pekerja pelanggan awal. Tetapi masih berkata Stay tuned.
Gambar
Dalam erti kata lain, versi ini masih lama, dan prestasi versi sebenar akan menjadi lebih baik.
Sejak dua hari lepas, model misteri bernama "Miqu" ini menjadi topik hangat dalam komuniti model besar, ramai juga mengesyaki bahawa ini adalah versi LIama yang telah diperhalusi.
Pictures
CEO Mistral menjelaskan bahawa mereka telah melatih semula Mistral Medium dan menambah baiknya berdasarkan Llama 2. Ini adalah untuk menyampaikan API yang hampir dengan prestasi GPT-4 kepada pelanggan awal secepat mungkin. Kerja pra-latihan telah selesai pada hari Mistral 7B dikeluarkan.
Sekarang kebenaran telah terbongkar, CEO masih berahsia, dan ramai netizen yang mencucuk tangan mereka dalam jangkaan.
Gambar
Gambar
Mari kita semak semula keseluruhan kejadian. Pada 28 Januari, seorang pengguna misteri bernama Miqu Dev menyiarkan satu set fail "miqu-1-70b" di HuggingFace.
Pictures
Dokumen tersebut menyatakan bahawa "format segera" dan kaedah interaksi pengguna LLM baharu adalah sama seperti Mistral.
Pada hari yang sama, pengguna tanpa nama di 4chan menyiarkan pautan ke fail miqu-1-70b.
Jadi ada netizen yang perasan model misteri ini dan mula menjalankan beberapa ujian penanda aras.
Hasilnya menakjubkan: ia mendapat markah 83.5 pada EQ-Bench (penilaian tempatan), menungguli semua model besar lain di dunia kecuali GPT-4.
Untuk sementara waktu, netizen menggesa agar model besar ini dimasukkan ke dalam ranking dan mengetahui model sebenar di sebaliknya.
Terdapat tiga arah utama syak wasangka:
Sesetengah netizen menyiarkan kesan perbandingan: Ia tahu jawapan standard dan ia masuk akal, tetapi adalah mustahil walaupun perkataan Rusia sama persis dengan Mistral-Medium.
Gambar
Tetapi netizen lain mendapati ia bukan model KPM, dan mempunyai seni bina yang sama, parameter yang sama dan bilangan lapisan yang sama seperti LIama 2.
Gambar
Namun, ia segera dipersoalkan oleh netizen lain Mistral 7b juga mempunyai parameter dan bilangan lapisan yang sama seperti llama 7B.
Sebaliknya, ini lebih seperti model Mistral versi awal bukan MoE.
Gambar
Namun, selepas berbincang, memang tidak dinafikan dalam fikiran ramai, inilah model yang paling hampir dengan GPT-4.
Pictures
Kini, pengasas bersama dan Ketua Pegawai Eksekutif Mistral Arthur Mensch telah mengakui bahawa salah seorang pekerja pelanggan awal mereka terlalu bersemangat dan membocorkan versi terkuantisasi model lama yang mereka latih dan keluarkan secara terbuka.
Bagi Perplexity, CEO juga menjelaskan bahawa mereka tidak pernah menerima berat Mistral Medium.
Gambar
Netizen bimbang sama ada versi ini akan dialih keluar.
Gambar
Menariknya, Mensch tidak meminta siaran di HuggingFace dibuang.
Gambar
Sebaliknya, tinggalkan ulasan yang menyatakan: Isu atribusi boleh dipertimbangkan.
Pautan rujukan:
[1]https://www.reddit.com/r/LocalLLaMA/comments/1af4fbg/llm_comparisontest_miqu170b/
[2]https://twitter.com/teortaxesTex915
[3]https://twitter.com/N8Programs/status/1752441060133892503
[4]https://twitter.com/AravSrinivas/status/1752803571035504858
Atas ialah kandungan terperinci Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!