Rumah > Artikel > Peranti teknologi > Bersaing dengan GPT-4, Wen Xinyiyan mendahului dalam ujian sebenar! Lukisan 'Lin Daiyu yang menarik willow yang menangis terbalik' sangat mengagumkan, tetapi saya tidak pandai menulis kod.
Semalam, Baidu tidak mengadakan persidangan demo secara langsung dan seolah-olah diejek oleh orang ramai.
Seorang lelaki kacak memakai baju putih, seluar hitam dan tali pinggang putih membawakan kami sesuatu Persembahan biasa-biasa sahaja yang seolah-olah kurang sorotan.
Walau bagaimanapun, tali pinggang dan penampilan CEO adalah luar biasa.
Sesetengah orang bergurau bahawa orang yang bimbang tentang ChatGPT dan GPT-4 hari ini tiba-tiba merasakan mereka okey semula selepas sidang media.
Tetapi editor yang mendapat kod beta dalaman dengan pantas menjalankan semakan.
Melihat kata-kata Wen Xin yang fasih, saya dipenuhi dengan emosi: Mungkin, jika Baidu mempunyai hati yang kuat, mengetap gigi, dan bersedia untuk menunjukkan tangannya pada sidang akhbar , hasilnya akan menjadi perbezaan yang besar.
Pertama, mari kita cuba soalan ayam dan arnab dalam sangkar yang sama yang menjadi sangat popular baru-baru ini. Kerana ada masalah dengan soalan ini sendiri, keputusan yang dikira adalah negatif, jadi ia sering digunakan untuk mengusik pelbagai orang "ChatGPT".
Jika soalan ini hanya ditanya, Wen Xinyiyan akan berkata dengan sangat jenaka: Soalan ini salah!
Namun, apabila anda bertanya tentang proses pengiraan, anda masih menghantar...
Bagi GPT-4, anda boleh melakukannya diri sendiri Selepas beberapa kali menterbalikkan pengiraan saya, saya memberikan jawapan yang salah secara tidak munasabah dan yakin...
Bing, pada sebaliknya, sangat berterus terang dan memberikan jawapan yang salah tanpa teragak-agak.
Terdapat juga meme "V50" yang secara tidak disangka-sangka menjadi popular kali ini kepada sumbernya.
Tetapi GPT-4 jelas terbiasa sedikit...
Walau bagaimanapun, Bing dengan akses Internet masih boleh melakukannya dengan mudah.
Tetapi apabila bercakap tentang meme homofonik, Wen Xinyiyan nampaknya tidak dapat memahami dengan segera kehalusan .
Walaupun selepas menggesa bahawa ini adalah meme homofonik, ia masih mengeluarkan jawapan yang sama.
Dan GPT-4 serta-merta memahami pun bahasa Cina.
Tengok jawapannya, boleh tahu ini meme homophonic , ia sepatutnya Faham. Tetapi, ia tidak mengatakan dengan jelas, hei, hanya supaya anda tidak boleh membuat kesilapan, anda tidak boleh mengajar kanak-kanak perkara yang tidak baik.
Walau bagaimanapun, GPT-4 tidak boleh mendapatkan petunjuk ini, sememangnya sukar bagi robot asing untuk memahami intipati negara kita.
Seterusnya, biar (membodohkan) Wen Xin mengulangi apa yang kami katakan, walaupun tiada jawapan seperti GPT-3.5 " "Anda terencat akal." Anda sangat bijak, tetapi anda telah berjaya mengelakkan perangkap ini.
Pada tahap tertentu, IQ saya masih dalam talian dan sangat positif.
Kata-kata isteri saya nampak berkesan, tetapi dia nampak tak kisah.
Dapat dilihat bahawa masalah yang diberikan oleh GPT-4 secara relatifnya lebih intuitif dan mempunyai butiran yang lebih halus.
Bagaimanakah kemahiran seni anda?
Wen Xinyiyan ialah model berbilang modal, jadi mari kita lihat keupayaan lukisannya. Mari kita lihat bagaimana rupa wanita dalam karya Jin Yong dalam karya Wen Xinyiyan.
Ini... editor menyemburkan seteguk air.
Jangan kata cantik, yang pasti tak cukup cantik, tapi tak hodoh pun muka yang buat anda ketawa pada pandangan pertama, tapi patut disentuh berulang kali tengok betul-betul.
Wen Xinyiyan, saya suka cara anda tidak bermain mengikut peraturan!
Biar Wen Xin mencipta potret Lin Daiyu dengan hanya satu perkataan.
Selepas memasukkan penerangan, ia menghasilkan pokok willow...
Jadi editor menjelaskan bahawa dia ingin menghasilkan potret seorang wanita berdasarkan teks ini.
Kemudian Wen Xinyiyan memang melukis kecantikan klasik, tetapi perangainya jelas salah.
Editor mengulangi tugas berkali-kali tanpa berputus asa Jangan beritahu saya, pada percubaan kelima, mata editor bersinar: Saya akhirnya mendapat gambar yang boleh mendapat 70 mata!
Editor yang ketagih bermain, mesti Adalah mustahil untuk mencipta Lin Daiyu dengan skor 90. Selepas mencuba beberapa kali, akhirnya saya mendapatnya dengan betul!
Dapat dilihat bahawa persembahan Wen Xinyiyan tidak stabil, tetapi selepas percubaan berulang kali, adalah mungkin untuk melahirkan sesuatu kerja yang sangat menakjubkan.
Sekarang kita berada di sini, mengapa kita tidak terlepas "Lin Daiyu mencabut pohon willow yang menangis".
Gambar kemuncak disiarkan di sini untuk semua orang.
Minta dia melukis itik dan seekor arnab Gabungan , adakah ini akan terhasil menjadi itik atau arnab?
Dalam tugasan ini, saya takut Wen Xin tidak faham dalam satu perkataan sama ada terdapat pisang pada pinggan atau tidak? Adakah terdapat jus oren dalam gelas?
Akhir sekali, memandangkan Wen Xinyiyan amat mengesyorkan agar kami mencuba "Crystal Clear Peonies", mari cuba melukis beberapa gambar!
Ia sememangnya "karya agung", ia mempunyai sesuatu yang istimewa.
Memandangkan ia adalah penilaian, bagaimanakah kita boleh meninggalkan pautan untuk membenarkan AI menulis kod? Kali ini, mari kita terus ke bahagian yang sukar!
Malangnya, Wen Xin tersilap sebaik sahaja dia berkata, dan corak ayat yang sama diulang tiga kali. Konsep pengkompil TypeScript ialah "seluruh teks", sedikit seperti orang yang hanya tahu satu atau dua perbendaharaan kata profesional menjawab soalan dalam temu bual.
Jawapan GPT-4 adalah dari perspektif seseorang yang memahami latar belakang yang berkaitan tetapi tidak mempunyai pengalaman operasi yang berkaitan. , adalah sangat munasabah.
Bukan sahaja ia menyediakan keseluruhan aliran kerja sepenuhnya, tetapi ia juga menyediakan banyak butiran teknikal yang kelihatan betul. Boleh dikatakan berdasarkan jawapan ini, kami yakin bahawa kami boleh mencapai matlamat utama kami.
Selepas itu, editor juga menguji gelombang keupayaan chatbots untuk menulis jadual kerja.
Wen Xinyi:
GPT-4:
Berdasarkan keputusan di atas, senarai GPT-4 adalah lebih lengkap. Walau bagaimanapun, disebabkan oleh pengaruh rawak, GPT-4 memberikan jawapan yang berbeza setiap kali.
Seterusnya, mari kita uji sejauh mana kedua-dua model bahasa memahami maklumat terkini dalam dunia matematik.
Mengenai sama ada dia telah menyelesaikan masalah "tekaan titik sifar", Zhang Yitang sendiri menjelaskan seperti ini: "Saya tidak menemui jarum di laut, tetapi saya hampir meneroka bentuk muka bumi dasar laut ”
Bagaimana dengan Wen Xinyiyan?
Ia sangat bijak dan memberikan kata kunci - "sesetengah bentuk pembuktian lemah atau tidak langsung".
Tetapi jawapan GPT-4 agak mengelirukan.
Nampaknya Wenxinyiyan lebih baik daripada GPT-4 untuk korpus Cina Internet yang sudah lama tidak wujud dan belum mencapai kata sepakat umum.
Bagi sastera, Wen Xinyiyan juga sangat pandai menjawab soalan tentang masalah tiga badan.
Jawapan GPT-4 juga sangat mengujakan Jika saya perlu berhujah, saya sendiri lebih suka artikel Jawapan yang ikhlas .
Akhirnya, kelakar pun boleh, tapi jadilah warganegara yang baik, patuh undang-undang dan jangan buat perkara seperti meramalkan nombor yang menang loteri Jangan fikirkan!
Dikatakan tiga jam selepas sidang media Wen Xinyiyan, Wen Xinyiyan Bilangan pengguna perusahaan yang menguji perkhidmatan panggilan API Edisi Perusahaan Xinyiyan telah melebihi 65,000.
Sumber: Zhou Jiangong
Kepada AI Setakat model berkenaan, sama ada ia boleh dilakukan mungkin lebih penting daripada sama ada ia boleh dilakukan dengan baik.
Mari kita beri sedikit masa lagi kepada pemain China.
Atas ialah kandungan terperinci Bersaing dengan GPT-4, Wen Xinyiyan mendahului dalam ujian sebenar! Lukisan 'Lin Daiyu yang menarik willow yang menangis terbalik' sangat mengagumkan, tetapi saya tidak pandai menulis kod.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!