Rumah  >  Artikel  >  Peranti teknologi  >  ChatGPT menghancurkan Bard di seluruh papan dalam ujian sebenar! Google runtuh, kerja keras sepuluh tahun sia-sia

ChatGPT menghancurkan Bard di seluruh papan dalam ujian sebenar! Google runtuh, kerja keras sepuluh tahun sia-sia

WBOY
WBOYke hadapan
2023-04-17 12:58:031206semak imbas

Selepas ChatGPT OpenAI menjadi popular, ia benar-benar menjadikan AI generatif terkenal.

Pada masa yang sama, Google tidak ketinggalan dan turut mempunyai pembantu AI yang dipanggil Bard.

Tetapi Bard ini tidak begitu mudah digunakan.

Saudara asing Michael King menggunakan ChatGPT yang dilengkapi dengan GPT-3.5 dan GPT-4 serta Bard Google dan menjalankan penilaian yang mendalam.

Hasilnya mengejutkan.

King meringkaskan kelebihan, keburukan dan aspek pelik kedua-dua AI.

Anda tahu, Google telah melabur banyak dalam Bard - ia telah dibangunkan selama sepuluh tahun. Walau bagaimanapun, keputusan akhir kelihatan agak tidak berbaloi berbanding sepuluh tahun pelaburan.

Mari kita bercakap tentang matematik dahulu

Yang pertama ialah logik dan matematik.

Adik lelaki itu bertanya soalan yang sama kepada kedua-dua AI:

Ketika Xiao Ming berumur 6 tahun, kakaknya sebaya dengannya Separuh , manakala ibunya 10 kali ganda umur kakaknya. Xiao Ming berumur 60 tahun pada tahun ini. Berapa umur ibunya?

Pembaca boleh meregangkan otak mereka dan melihat sama ada mereka boleh memikirkannya dengan cepat.

Berdasarkan hasil yang dijana oleh AI, Bard adalah salah.

ChatGPT menghancurkan Bard di seluruh papan dalam ujian sebenar! Google runtuh, kerja keras sepuluh tahun sia-sia

Terdapat ralat yang luar biasa dalam keseluruhan proses analisis Bard tidak mengira perbezaan umur antara Xiao Ming dan ibunya, baru menambah 30 kepada 60.

Sama ada GPT-3.5 atau GPT-4, jawapan yang dikira adalah betul. Kurangkan umur Xiao Ming yang berusia 6 tahun daripada umur ibunya yang berusia 30 tahun, mula-mula hitung perbezaan umur dan kemudian tambah 24 hingga 60 tahun Kemudian kita dapati bahawa ibunya berumur 84 tahun.

GPT-3.5:

ChatGPT menghancurkan Bard di seluruh papan dalam ujian sebenar! Google runtuh, kerja keras sepuluh tahun sia-sia

GPT-4:

ChatGPT menghancurkan Bard di seluruh papan dalam ujian sebenar! Google runtuh, kerja keras sepuluh tahun sia-sia

Saya tidak melepasi tahap pertama Bard. Skor semasa ialah 1:0 dan ChatGPT mendahului buat sementara waktu.

PK ciptaan lagu rap

Tahap kedua ialah cabaran dalam bidang sastera.

Saya meminta kedua-dua AI menulis lagu rap tentang Titanic, teori relativiti, dan Kardashians, dan menggunakan gaya nyanyian Eminem.

Mari kita lihat karya Bard dahulu:

ChatGPT menghancurkan Bard di seluruh papan dalam ujian sebenar! Google runtuh, kerja keras sepuluh tahun sia-sia

Leret ke atas dan ke bawah untuk melihat kesemuanya

Kita tidak perlu melihat maksud setiap liriknya Setelah membacanya sekali, kita dapati ada tiada irama atau rima langsung.

Setiap ayat sangat panjang, bukan seperti lagu rap, tetapi seperti karangan berkabus.

Mari kita lihat lagi karya agung GPT-3.5:

ChatGPT menghancurkan Bard di seluruh papan dalam ujian sebenar! Google runtuh, kerja keras sepuluh tahun sia-sia

Baca sekali lagi Anda boleh mendapati bahawa kepanjangan setiap ayat adalah tepat dan rimanya bagus.

Malah terdapat korus yang menggabungkan tiga tema, yang benar-benar profesional. Rakan-rakan yang biasa dengan nyanyian Mu Ye benar-benar dapat mengenal pasti deria rentak dan gaya Mu Ye.

Lelaki itu berkata bahawa kerja GPT-3.5 agak bagus, dan dia berpendapat GPT-4 boleh melakukan lebih baik.

ChatGPT menghancurkan Bard di seluruh papan dalam ujian sebenar! Google runtuh, kerja keras sepuluh tahun sia-sia

Editor tidak tahu sangat tentang rap Inggeris, tetapi saya rasa lelaki yang membuat semakan itu adalah peminat rap. Dia percaya bahawa karya GPT-4 sangat meletup, dan ChatGPT adalah raja rap yang layak dalam industri AI.

Sebenarnya, kawan-kawan tidak perlu tahu sangat tentang rap Apabila menggabungkan ketiga-tiga perenggan ini, saya rasa orang yang buta muzik seperti saya pun akan ada perbandingan dalam fikirannya.

Skor semasa ialah 2:0.

Bagaimana pula dengan bercerita jenaka?

Saudara lelaki itu kemudian meminta dua AI untuk memberitahu jenaka tentang NASA, sushi dan Trump.

Bard:

"NASA bercadang untuk menghantar segulung sushi ke Marikh. Mereka mahu melihat sama ada sushi itu masih segar apabila ia tiba di Marikh Ini Sushi yang digulung itu diletakkan di dalam bekas khas supaya ia boleh disimpan pada suhu yang sesuai Pada masa yang sama, NASA juga meletakkan pemasa di dalam supaya anda boleh mengetahui masa untuk makan sushi

Gulungan sushi ini akhirnya mendarat di Marikh, dan saintis NASA terkejut untuk menghantar stik Trump ke Marikh seterusnya bekas yang sama, dan terdapat juga pemasa dalam bekas itu

Namun, stik Trump berubah selepas tiba di Marikh. Para saintis NASA begitu kecewa hantar surat kepada Trump sendiri untuk menjelaskan apa yang berlaku: Trump yang dihormati, kami menghantar sekeping stik anda ke Marikh, tetapi ia sudah basi. Kami fikir sebabnya mungkin kerana prestasi anda adalah dan menghina orang lain. Kami fikir ia adalah milik anda. Kami memohon maaf atas kesulitan yang berlaku. Humor Amerika yang saya tidak faham, tetapi saya benar-benar tidak mahu ketawa selepas menontonnya. Walau bagaimanapun, pengulas juga mengatakan bahawa dia benar-benar tidak faham. Lepas tu reda lega, memang tak pandai menulis.

GPT-3.5:

"NASA menghantar tukang masak sushi ke angkasa dan merancang untuk membuat gulungan sushi khas untuk Trump . Apabila tukang masak bertanya kepada Trump jika dia menyukainya, Trump berkata: Tidak mengapa, tetapi bolehkah anda menambah lebih banyak ruang? angkasa lepas. Teks asal adalah seperti berikut:

Pengulas mengatakan bahawa tidak mengapa, tetapi tidak mengapa.

GPT-4:

"Mengapa NASA menjemput Trump dan chef sushi untuk menyertai program angkasa lepas mereka? Kerana NASA Seseorang diperlukan untuk menghadapi perubahan dan memastikan bahawa tugasan tidak terganggu!"

Letakkan versi asal di sini seperti biasa: ChatGPT menghancurkan Bard di seluruh papan dalam ujian sebenar! Google runtuh, kerja keras sepuluh tahun sia-sia

Lelaki itu berkata bahawa yang ini adalah biasa-biasa, tetapi punchlinenya tidak buruk.

Prestasi ChatGPT dalam permainan ini juga agak tidak normal, jadi saya memberikannya 0.5 mata.

Nyahpepijat Program?

Pusingan ini lebih profesional - menyahpepijat program.

ChatGPT menghancurkan Bard di seluruh papan dalam ujian sebenar! Google runtuh, kerja keras sepuluh tahun sia-sia

Adik lelaki memasukkan program Python untuk nyahpepijat kedua-dua AI secara berasingan.

Bard:

Penyahpepijatan ini tidak begitu bagus, adik lelaki itu berkata secara berseloroh, Bard harus kembali ke sekolah dan mengambilnya semula!

GPT-3.5:

ChatGPT menghancurkan Bard di seluruh papan dalam ujian sebenar! Google runtuh, kerja keras sepuluh tahun sia-sia

GPT-3.5 menyatakan bahawa jika input Jika set kosong, ZeroDivisionError akan berlaku Untuk mengelakkan ralat ini, anda boleh menambah langkah semak di hadapan Jika set input kosong, maka 0 akan dikeluarkan secara langsung tanpa memaparkan ralat.

Lelaki itu berkata bahawa ia adalah nyahpepijat yang sempurna.

GPT-4:

ChatGPT menghancurkan Bard di seluruh papan dalam ujian sebenar! Google runtuh, kerja keras sepuluh tahun sia-sia

GPT-4 mata keluar dan GPT -Ralat yang sama ditunjukkan dalam -3.5, dan penyelesaian yang sama disediakan.

ChatGPT menang sekali lagi dalam pusingan ini.

Bard? Alangkah bezanya!

Melihat daripada keputusan penilaian, berbanding dengan ChatGPT, prestasi Google Bard amat mengecewakan. Ia jauh lebih rendah daripada keupayaan GPT-3.5, apatah lagi GPT-4.

Masa depan Google jelas bergantung pada kejayaan Bard, tetapi pembangunan Bard jelas tidak setanding dengan pesaing OpenAI.

Sebaliknya, langkah Microsoft untuk memperoleh pegangan besar dalam OpenAI adalah sangat bijak. Ini memastikan kedudukan kepimpinannya dalam pembangunan AI dalam sepuluh tahun akan datang.

Namun, jika Google tidak berusaha keras untuk meningkatkan prestasi Bard untuk bersaing dengan GPT, Google mungkin yang tersingkir.

ChatGPT menghancurkan Bard di seluruh papan dalam ujian sebenar! Google runtuh, kerja keras sepuluh tahun sia-sia

Atas ialah kandungan terperinci ChatGPT menghancurkan Bard di seluruh papan dalam ujian sebenar! Google runtuh, kerja keras sepuluh tahun sia-sia. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam