Rumah >Peranti teknologi >AI >Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBke hadapan: 2024-02-01 21:00:471098semak imbas

Mistral-Medium terbocor secara tidak sengaja? Sebelum ini hanya tersedia melalui API, prestasi hampir dengan GPT-4.

Kenyataan terbaru CEO: Memang benar, ia telah dibocorkan oleh pekerja pelanggan awal. Tetapi masih berkata Stay tuned.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat Gambar

Dalam erti kata lain, versi ini masih lama, dan prestasi versi sebenar akan menjadi lebih baik.

Sejak dua hari lepas, model misteri bernama "Miqu" ini menjadi topik hangat dalam komuniti model besar, ramai juga mengesyaki bahawa ini adalah versi LIama yang telah diperhalusi.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat Pictures

CEO Mistral menjelaskan bahawa mereka telah melatih semula Mistral Medium dan menambah baiknya berdasarkan Llama 2. Ini adalah untuk menyampaikan API yang hampir dengan prestasi GPT-4 kepada pelanggan awal secepat mungkin. Kerja pra-latihan telah selesai pada hari Mistral 7B dikeluarkan.

Sekarang kebenaran telah terbongkar, CEO masih berahsia, dan ramai netizen yang mencucuk tangan mereka dalam jangkaan.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat Gambar

Mistral-Medium secara tidak sengaja bocor

Mari kita semak semula keseluruhan kejadian. Pada 28 Januari, seorang pengguna misteri bernama Miqu Dev menyiarkan satu set fail "miqu-1-70b" di HuggingFace.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat Pictures

Dokumen tersebut menyatakan bahawa "format segera" dan kaedah interaksi pengguna LLM baharu adalah sama seperti Mistral.

Pada hari yang sama, pengguna tanpa nama di 4chan menyiarkan pautan ke fail miqu-1-70b.

Jadi ada netizen yang perasan model misteri ini dan mula menjalankan beberapa ujian penanda aras.

Hasilnya menakjubkan: ia mendapat markah 83.5 pada EQ-Bench (penilaian tempatan), menungguli semua model besar lain di dunia kecuali GPT-4.

Untuk sementara waktu, netizen menggesa agar model besar ini dimasukkan ke dalam ranking dan mengetahui model sebenar di sebaliknya.

Terdapat tiga arah utama syak wasangka:

dan Mistral-Medium adalah model yang sama.

Sesetengah netizen menyiarkan kesan perbandingan: Ia tahu jawapan standard dan ia masuk akal, tetapi adalah mustahil walaupun perkataan Rusia sama persis dengan Mistral-Medium.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat Gambar

Miqu sepatutnya menjadi versi LIama 2 yang diperhalusi.

Tetapi netizen lain mendapati ia bukan model KPM, dan mempunyai seni bina yang sama, parameter yang sama dan bilangan lapisan yang sama seperti LIama 2.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat Gambar

Namun, ia segera dipersoalkan oleh netizen lain Mistral 7b juga mempunyai parameter dan bilangan lapisan yang sama seperti llama 7B.

Sebaliknya, ini lebih seperti model Mistral versi awal bukan MoE.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat Gambar

Namun, selepas berbincang, memang tidak dinafikan dalam fikiran ramai, inilah model yang paling hampir dengan GPT-4.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat Pictures

Kini, pengasas bersama dan Ketua Pegawai Eksekutif Mistral Arthur Mensch telah mengakui bahawa salah seorang pekerja pelanggan awal mereka terlalu bersemangat dan membocorkan versi terkuantisasi model lama yang mereka latih dan keluarkan secara terbuka.

Bagi Perplexity, CEO juga menjelaskan bahawa mereka tidak pernah menerima berat Mistral Medium.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat Gambar

Netizen bimbang sama ada versi ini akan dialih keluar.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat Gambar

Menariknya, Mensch tidak meminta siaran di HuggingFace dibuang.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat Gambar

Sebaliknya, tinggalkan ulasan yang menyatakan: Isu atribusi boleh dipertimbangkan.

Pautan rujukan:
[1]https://www.reddit.com/r/LocalLLaMA/comments/1af4fbg/llm_comparisontest_miqu170b/
[2]https://twitter.com/teortaxesTex915
[3]https://twitter.com/N8Programs/status/1752441060133892503
[4]https://twitter.com/AravSrinivas/status/1752803571035504858

Atas ialah kandungan terperinci Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

架构事件 https gpt llama

Kenyataan：

Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam

Artikel sebelumnya：Laporan terkini daripada Microsoft dan IDC: Setiap $1 yang dilaburkan dalam AI boleh membawa pulangan sebanyak $3.5Artikel seterusnya：Laporan terkini daripada Microsoft dan IDC: Setiap $1 yang dilaburkan dalam AI boleh membawa pulangan sebanyak $3.5

Artikel berkaitan

Lihat lagi