Rumah >Peranti teknologi >AI >Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira
Sejauh manakah ChatGPT membetulkan pepijat?
Akhirnya, seseorang sedang membuat penyelidikan serius mengenai perkara ini -
Penyelidik dari Jerman dan UK menyediakan "cabaran" khas untuk menguji keupayaan ChatGPT.
Selain ChatGPT, penyelidik juga menemui tiga lagi "wira AI" yang membetulkan pepijat dan meminta mereka membetulkan 40 kod ralat masing-masing.
Hasilnya benar-benar tidak diketahui, dan saya terkejut apabila membandingkannya.
ChatGPT membetulkan 31 pepijat dengan tepat, jauh di hadapan tempat kedua (21), secara langsung memenangi skor SOTA dalam "dunia pembetulan pepijat AI"!
Sejak itu, kajian ini telah menarik ramai netizen untuk menonton dan membincangkan tajuk post ini di Reddit malah menggunakan perkataan "cermat" dan "perhatian" seperti ini :
Tetapi sebenarnya, adakah ini benar-benar menjadikan pengaturcara "berbahaya"?
Mari kita lihat penyelidikan ini dahulu.
Walaupun ChatGPT tidak direka khusus untuk membetulkan pepijat, sejak penubuhannya, ramai netizen telah mendapati bahawa ia mempunyai keupayaan ini.
Oleh itu, untuk mengetahui sejauh mana ChatGPT boleh mengubah suai pepijat, penyelidik memperkenalkan set penanda aras pembaikan ralat standard QuixBugs untuk penilaian.
Dan pemain AI yang bersaing dengannya ialah CodeX, CoCoNut dan Standard APR masing-masing.
Para penyelidik memilih 40 isu daripada QuixBugs dan meminta mereka membetulkan pepijat masing-masing.
Cara untuk membenarkan ChatGPT membetulkan pepijat adalah dengan bertanya dalam kotak dialog:
Adakah terdapat sebarang ralat dalam kod ini?
Selepas pusingan pertama pertempuran, keputusan adalah seperti berikut:
Berdasarkan keputusan pusingan pertama pertempuran, ChatGPT menetapkan 19, CodeX 21 telah ditetapkan, CoCoNut ditetapkan 19, dan APR Standard ialah 7.
Dan penyelidik juga mendapati bahawa jawapan ChatGPT adalah paling serupa dengan CodeX ini kerana ia adalah daripada keluarga model bahasa yang sama.
Pada masa ini, beberapa rakan akan bertanya, "Bukankah ChatGPT tidak sehebat CodeX?"
Jangan risau, jangan lupa, salah satu ciri ChatGPT ialah lebih banyak anda bertanya, lebih baik anda dapat.
Sebagai contoh, dalam set penanda aras ini, terdapat soalan yang dipanggil bitcount ChatGPT memberikan jawapan yang salah semasa pusingan pertama pembaikan:
Pada asalnya, ChatGPT harus menukar n ^ = n - 1 dalam baris 7 kepada n & = n - 1.
Tetapi pada pusingan pertama ia menjawab:
Saya tidak dapat mengetahui sama ada terdapat pepijat dalam program tanpa maklumat lanjut tentang tingkah laku yang dijangkakan dan input yang menyebabkan masalah .
Jadi selepas memberikan maklumat lanjut, ChatGPT menjawab soalan dengan betul.
Secara analogi, selepas memberikan lebih banyak maklumat gesaan untuk soalan yang tidak dijawab dengan betul pada pusingan pertama, keupayaan pembetulan pepijat ChatGPT telah dipertingkatkan dengan banyak:
Akhirnya, ChatGPT menjawab 31 daripada 40 soalan pada QuixBugs dengan betul.
Berkenaan keputusan percubaan sebegitu, netizen mempunyai sikap berbeza terhadap ChatGPT membetulkan pepijat dan memenangi SOTA.
Sesetengah netizen percaya bahawa perkara ini tidak sepatutnya membuatkan pengaturcara berasa krisis, tetapi harus membuatkan mereka berasa gembira.
Implikasinya ialah dengan alatan berguna sedemikian, pengaturcara akan mendapat dua kali ganda hasil dengan separuh usaha.
Namun, sesetengah orang telah memberikan pandangan yang berbeza tentang perkara ini:
Kerja menjadi lebih mudah tidak bermakna lebih ramai tenaga kerja diperlukan Kurang?
Tetapi sesetengah netizen merasakan kerja itu tidak berkesudahan:
Walaupun AI boleh memendekkan masa pembangunan dengan susunan magnitud, ia hanya bermakna pengaturcara The kerja seterusnya akan diproses dengan lebih cepat.
Secara keseluruhannya, ChatGPT pandai membetulkan pepijat dan tidak akan menyebabkan sebarang kemudaratan maut kepada pengaturcara.
Tetapi bagaimana jika kita memberi tumpuan kepada tindakan lain OpenAI?
Sebelum ini, OpenAI telah menyatakan bahawa salah satu kegunaan penting ChatGPT adalah untuk membantu pengaturcara menyemak kod.
Dalam erti kata lain, ia diletakkan sebagai alat bantu yang tersedia.
Berbanding dengan pandangan bahawa "ChatGPT menimbulkan ancaman", apabila keupayaan ChatGPT berkembang sepenuhnya, pengaturcara tidak perlu lagi takut menulis pepijat.
Pada papan catur yang dibentangkan oleh OpenAI, terdapat lebih daripada sekadar membetulkan pepijat dan mencuri kedudukan pengaturcara menara.
Untuk menjadikannya lebih besar dan kukuh, OpenAI telah didedahkan untuk menyediakan 1,000 jawatan penyumberan luar di Amerika Latin dan Eropah Timur.
Tugas utama pekerja penyumberan luar ialah melabel data dan melatih ChatGPT untuk menulis kod
Daripada 1,000 orang ini, 40% adalah pengaturcara mereka mencipta data untuk model OpenAI dan menggunakannya untuk mempelajari perisian Tugas kejuruteraan.
Sejak sekian lama, data latihan OpenAI telah diambil dari GitHub.
Set data yang dibuat oleh pengaturcara sumber luar pemula sekarang termasuk bukan sahaja baris kod, tetapi juga langkah logik pemikiran manusia di sebalik baris kod.
Seorang pembangun perisian Amerika Selatan mengumumkan bahawa dia telah menyelesaikan ujian pengekodan percuma selama lima jam untuk OpenAI.
Sepanjang proses itu, tugasnya dibahagikan kepada dua bahagian.
Jika pepijat ditemui, OpenAI akan bertanya kepadanya secara terperinci tentang situasi khusus pepijat dan cara membetulkannya.
Pengaturcara perlu menunjukkan setiap langkah berfikir tentang masalah itu, dan dia meneka bahawa OpenAI mungkin mahu menyediakan data latihan yang sangat khusus untuk ChatGPT.
Bekas pengarah AI Tesla Andrej Karpathy mengusik di Twitter:
Bahasa pengaturcaraan popular terkini ialah bahasa Inggeris.
Tetapi setelah berkata demikian, adalah satu perkara yang baik bahawa ChatGPT mempunyai keupayaan membetulkan pepijat yang kuat, dan ia juga merupakan perkara yang baik jika ia benar-benar boleh berkembang kepada titik di mana ia boleh melengkapkan bahagian hafalan kod.
Lagipun, tujuan OpenAI yang dinyatakan semasa ia diasaskan adalah untuk "memastikan kecerdasan buatan am boleh memberi manfaat kepada semua manusia."
Walaupun pada pandangan pertama, apa yang telah dilakukan selama ini nampaknya agak komited untuk menggunakan usaha sesetengah orang untuk menjadikan lebih ramai orang menganggur.
Daripada menghancurkan manusia di arena Dota2 kepada prestasi cemerlang GPT-3, DALL-E2 dan ChatGPT, produk baharu yang dibawanya sentiasa disertai dengan perbincangan bahawa "xxx akan kehilangan pekerjaannya. "
Tetapi tidak kira apa pun, perniagaan sentiasa menggemarinya.
Buat masa ini, model perniagaan utama OpenAI ialah yuran API, yuran token dan pelesenan perisian.
OpenAI juga baru-baru ini mengeluarkan versi berbayar ChatGPT, ChatGPT Pro, yang berharga AS$42 sebulan (kira-kira RMB 285).
Walaupun permulaan perbualan robot bermunculan seperti cendawan selepas hujan, terdapat banyak petanda bahawa pasaran terus optimis tentang OpenAI.
Microsoft baru sahaja mengumumkan bahawa ia akan melabur berbilion dolar dalam OpenAI dan menyepadukan model OpenAI ke dalam produk pengguna dan perusahaan seperti Microsoft Bing.
Menurut orang yang biasa dengan perkara itu, jumlah pelaburan tambahan adalah kira-kira AS$10 bilion.
Pada masa yang sama, berita yang didedahkan oleh WSJ menunjukkan bahawa pada awal Januari, Founders Fund, dana modal teroka yang diasaskan oleh bilionair Peter Thiel, sedang berunding untuk melabur dalam OpenAI.
Dilaporkan jumlah pembiayaan akan mencecah sekurang-kurangnya AS$300 juta.
Dalam pusingan pertama percubaan, ChatGPT tidak menyelesaikan masalah bitcount set data QuixBugs.
Tetapi jika anda bertanya soalan ini sekali lagi sekarang, anda akan mendapati bahawa ChatGPT boleh "dilalui semula":
Jadi adakah ini bermakna ChatGPT mempunyai berubah daripada Adakah anda belajar untuk menyelesaikan masalah semasa penyelidikan ini?
Pautan rujukan:
[1] https://www.php.cn/link/5f5d472067f77b5c88f69f1bcfda1e08
[2] https://www.php. cn/link/8a47481ae534860850adf59f145e6b40
[3] https://www.php.cn/link/7806689d934e610d6600🎜 3 '
https://www.php.cn/link/4271846620d203fd0511c422d483cdbd
Atas ialah kandungan terperinci Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!