cari
RumahPeranti teknologiAIGPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Senarai berwibawa "Pertandingan Kelayakan Model Besar" Chatbot Arena telah dimuat semula:

Google Bard melepasi GPT-4 dan menduduki tempat kedua, kedua selepas GPT-4 Turbo.

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Namun, ramai netizen menyatakan "tidak puas hati" dan "tidak adil" mengenai perkara ini.

Ternyata Jeff Dean, ketua Google AI, mendedahkan bahawa prestasi Bard telah bertambah baik kerana ia dilengkapi dengan versi baharu model besar-Gemini Pro-skala.

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Ini juga bermakna Bard bermain dalam "perlawanan peringkat" mempunyai keupayaan untuk menyambung ke Internet.

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Ragu-ragu netizen berkisar tentang perkara ini:

Sangat mudah untuk menimbulkan salah faham dengan mencampurkan model besar dalam talian dan luar talian pada senarai kedudukan yang sama. .

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Dalam pelbagai keraguan, Imsys secara rasmi bertindak balas, menyatakan:

arena kedudukan adalah masa nyata adalah terbuka dan telus, dan penyelidikan mengenai kepelbagaian segera pengguna dan kualiti pengundian serta set data yang sepadan akan dikeluarkan tidak lama lagi

Berkenaan isu yang paling dibimbangkan oleh netizen, GPT-4, yang diatasi oleh Bard, adalah satu; versi luar talian, Imsys berkata " Jika akses kepada data masa nyata boleh meningkatkan pengalaman pengguna, kedudukan akan mencerminkannya." GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Dan secara langsung @OpenAI dan Bing, serta eksekutif Microsoft Mikhail Parakhin, menyatakan kesediaan mereka untuk menambah versi dalam talian GPT-4 atau Bing Copilot ke arena.

Berita terkini ialah model terbaru OpenAI gpt-4-0125-preview kini telah memasuki arena dan sedang menunggu pengguna untuk mengambil bahagian dalam pengundian.
  • Bagaimana Bard mengatasi GPT-4?

Chatbot Arena ialah senarai model besar yang berwibawa, dicipta oleh organisasi Imsys (Organisasi Sistem Model Besar) yang diketuai oleh penyelidik UC Berkeley.

Kedudukan ini menggunakan peraturan undian 1V1pertempuran tanpa nama dan disenaraikan berdasarkan sistem penilaian Elo.

Secara khusus, halaman undian adalah seperti berikut Kedua-dua model, Model A dan B, kedua-duanya tanpa nama. dan A dan B. Kedua-dua A dan B adalah sama baik.

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Perlu dinyatakan bahawa jika identiti model dibocorkan semasa proses soal jawab, undian akan menjadi tidak sah.

Mengikut senarai semasa, terdapat 56 model besar dalam arena:

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Sebelum ini, GPT-4 mendominasi senarai itu untuk masa yang lama dengan skor "jauh ke hadapan". daripada versi baharu Bard, ia secara langsung mengatasi GPT- Kedua-dua versi 4 bergegas ke tempat kedua, dan hanya 34 mata di belakang tempat pertama GPT-4 Turbo:

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Dengan lebih terperinci, dalam semua Model Perlawanan A vs. B tanpa seri, Model Perkadaran kemenangan A adalah seperti berikut:

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

dan bilangan perlawanan kepala bagi setiap pasangan kombinasi model

(tiada seri) GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran:

Selain itu, papan pendahulu Arena Chatbot menggunakan bootstrap untuk mencuba secara rawak anggaran skor Elo sebanyak 1,000 kali untuk menilai selang keyakinan dan banyak lagi.

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Kadar kemenangan purata bagi model tunggal berbanding semua model lain adalah seperti berikut:

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Walau bagaimanapun, perlu diperhatikan bahawa kedudukan Arena adalah masa nyata, dan walaupun Bard kini berada di kedudukan kedua, ia hanya mempunyai jumlah lebih daripada 3,000 undi.

Sebagai perbandingan, jumlah undian untuk GPT-4 Turbo telah mencecah 30,000+, dan undian kedua-dua versi yang diatasi juga beberapa kali ganda berbanding undian Bard.

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Sekarang versi terkini GPT-4 telah memasuki pasaran (walaupun masih belum dikemas kini mengenai ranking), kita perlu menunggu keputusan seterusnya~

Pautan rujukan: https:// twitter.com/lmsysorg /status/1752035632489300239.

Atas ialah kandungan terperinci GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Artikel ini dikembalikan pada:51CTO.COM. Jika ada pelanggaran, sila hubungi admin@php.cn Padam
Carta 10 kuasa bi yang paling banyak digunakan - Analytics VidhyaCarta 10 kuasa bi yang paling banyak digunakan - Analytics VidhyaApr 16, 2025 pm 12:05 PM

Memanfaatkan kekuatan visualisasi data dengan carta Microsoft Power BI Dalam dunia yang didorong oleh data hari ini, dengan berkesan menyampaikan maklumat yang rumit kepada penonton bukan teknikal adalah penting. Visualisasi data jambatan jurang ini, mengubah data mentah i

Sistem Pakar di AISistem Pakar di AIApr 16, 2025 pm 12:00 PM

Sistem Pakar: menyelam yang mendalam ke dalam kuasa membuat keputusan AI Bayangkan mempunyai akses kepada nasihat pakar mengenai apa -apa, dari diagnosis perubatan kepada perancangan kewangan. Itulah kuasa sistem pakar dalam kecerdasan buatan. Sistem ini meniru pro

Tiga coder getaran terbaik memecahkan revolusi AI ini dalam kodTiga coder getaran terbaik memecahkan revolusi AI ini dalam kodApr 16, 2025 am 11:58 AM

Pertama sekali, jelas bahawa ini berlaku dengan cepat. Pelbagai syarikat bercakap mengenai perkadaran kod mereka yang kini ditulis oleh AI, dan ini semakin meningkat pada klip pesat. Terdapat banyak anjakan pekerjaan

Runway AI's Gen-4: Bagaimanakah montaj AI boleh melampaui kebodohanRunway AI's Gen-4: Bagaimanakah montaj AI boleh melampaui kebodohanApr 16, 2025 am 11:45 AM

Industri filem, bersama semua sektor kreatif, dari pemasaran digital ke media sosial, berdiri di persimpangan teknologi. Sebagai kecerdasan buatan mula membentuk semula setiap aspek bercerita visual dan mengubah landskap hiburan

Bagaimana untuk mendaftar selama 5 hari kursus percuma ISRO AI? - Analytics VidhyaBagaimana untuk mendaftar selama 5 hari kursus percuma ISRO AI? - Analytics VidhyaApr 16, 2025 am 11:43 AM

Kursus Online AI/ML percuma ISRO: Gerbang ke Inovasi Teknologi Geospatial Pertubuhan Penyelidikan Angkasa India (ISRO), melalui Institut Pengesan Jauh India (IIRS), menawarkan peluang yang hebat untuk pelajar dan profesional

Algoritma Carian Tempatan di AIAlgoritma Carian Tempatan di AIApr 16, 2025 am 11:40 AM

Algoritma Carian Tempatan: Panduan Komprehensif Merancang acara berskala besar memerlukan pengagihan beban kerja yang cekap. Apabila pendekatan tradisional gagal, algoritma carian tempatan menawarkan penyelesaian yang kuat. Artikel ini meneroka pendakian bukit dan simul

Terbuka beralih fokus dengan GPT-4.1, mengutamakan pengekodan dan kecekapan kosTerbuka beralih fokus dengan GPT-4.1, mengutamakan pengekodan dan kecekapan kosApr 16, 2025 am 11:37 AM

Pelepasan ini termasuk tiga model yang berbeza, GPT-4.1, GPT-4.1 Mini dan GPT-4.1 Nano, menandakan langkah ke arah pengoptimuman khusus tugas dalam landskap model bahasa yang besar. Model-model ini tidak segera menggantikan antara muka yang dihadapi pengguna seperti

Prompt: CHATGPT menjana pasport palsuPrompt: CHATGPT menjana pasport palsuApr 16, 2025 am 11:35 AM

Gergasi Chip Nvidia berkata pada hari Isnin ia akan memulakan pembuatan superkomputer AI - mesin yang boleh memproses sejumlah besar data dan menjalankan algoritma kompleks - sepenuhnya dalam A.S. untuk kali pertama. Pengumuman itu datang selepas Presiden Trump Si

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
4 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
4 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
4 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Arahan sembang dan cara menggunakannya
4 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Alat panas

DVWA

DVWA

Damn Vulnerable Web App (DVWA) ialah aplikasi web PHP/MySQL yang sangat terdedah. Matlamat utamanya adalah untuk menjadi bantuan bagi profesional keselamatan untuk menguji kemahiran dan alatan mereka dalam persekitaran undang-undang, untuk membantu pembangun web lebih memahami proses mengamankan aplikasi web, dan untuk membantu guru/pelajar mengajar/belajar dalam persekitaran bilik darjah Aplikasi web keselamatan. Matlamat DVWA adalah untuk mempraktikkan beberapa kelemahan web yang paling biasa melalui antara muka yang mudah dan mudah, dengan pelbagai tahap kesukaran. Sila ambil perhatian bahawa perisian ini

VSCode Windows 64-bit Muat Turun

VSCode Windows 64-bit Muat Turun

Editor IDE percuma dan berkuasa yang dilancarkan oleh Microsoft

SublimeText3 Linux versi baharu

SublimeText3 Linux versi baharu

SublimeText3 Linux versi terkini

Muat turun versi mac editor Atom

Muat turun versi mac editor Atom

Editor sumber terbuka yang paling popular

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan