Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira-AI-php.cn

Rumah

Peranti teknologi

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

王林

Apr 15, 2023 am 09:16 AM

aichatgptSet data

Sejauh manakah ChatGPT membetulkan pepijat?

Akhirnya, seseorang sedang membuat penyelidikan serius mengenai perkara ini -

Penyelidik dari Jerman dan UK menyediakan "cabaran" khas untuk menguji keupayaan ChatGPT.

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Selain ChatGPT, penyelidik juga menemui tiga lagi "wira AI" yang membetulkan pepijat dan meminta mereka membetulkan 40 kod ralat masing-masing.

Hasilnya benar-benar tidak diketahui, dan saya terkejut apabila membandingkannya.

ChatGPT membetulkan 31 pepijat dengan tepat, jauh di hadapan tempat kedua (21), secara langsung memenangi skor SOTA dalam "dunia pembetulan pepijat AI"!

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Sejak itu, kajian ini telah menarik ramai netizen untuk menonton dan membincangkan tajuk post ini di Reddit malah menggunakan perkataan "cermat" dan "perhatian" seperti ini :

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Tetapi sebenarnya, adakah ini benar-benar menjadikan pengaturcara "berbahaya"?

Mari kita lihat penyelidikan ini dahulu.

ChatGPT pandai membetulkan pepijat

Walaupun ChatGPT tidak direka khusus untuk membetulkan pepijat, sejak penubuhannya, ramai netizen telah mendapati bahawa ia mempunyai keupayaan ini.

Oleh itu, untuk mengetahui sejauh mana ChatGPT boleh mengubah suai pepijat, penyelidik memperkenalkan set penanda aras pembaikan ralat standard QuixBugs untuk penilaian.

Dan pemain AI yang bersaing dengannya ialah CodeX, CoCoNut dan Standard APR masing-masing.

Para penyelidik memilih 40 isu daripada QuixBugs dan meminta mereka membetulkan pepijat masing-masing.

Cara untuk membenarkan ChatGPT membetulkan pepijat adalah dengan bertanya dalam kotak dialog:

Adakah terdapat sebarang ralat dalam kod ini?

Selepas pusingan pertama pertempuran, keputusan adalah seperti berikut:

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Berdasarkan keputusan pusingan pertama pertempuran, ChatGPT menetapkan 19, CodeX 21 telah ditetapkan, CoCoNut ditetapkan 19, dan APR Standard ialah 7.

Dan penyelidik juga mendapati bahawa jawapan ChatGPT adalah paling serupa dengan CodeX ini kerana ia adalah daripada keluarga model bahasa yang sama.

Pada masa ini, beberapa rakan akan bertanya, "Bukankah ChatGPT tidak sehebat CodeX?"

Jangan risau, jangan lupa, salah satu ciri ChatGPT ialah lebih banyak anda bertanya, lebih baik anda dapat.

Sebagai contoh, dalam set penanda aras ini, terdapat soalan yang dipanggil bitcount ChatGPT memberikan jawapan yang salah semasa pusingan pertama pembaikan:

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Pada asalnya, ChatGPT harus menukar n ^ = n - 1 dalam baris 7 kepada n & = n - 1.

Tetapi pada pusingan pertama ia menjawab:

Saya tidak dapat mengetahui sama ada terdapat pepijat dalam program tanpa maklumat lanjut tentang tingkah laku yang dijangkakan dan input yang menyebabkan masalah .

Jadi selepas memberikan maklumat lanjut, ChatGPT menjawab soalan dengan betul.

Secara analogi, selepas memberikan lebih banyak maklumat gesaan untuk soalan yang tidak dijawab dengan betul pada pusingan pertama, keupayaan pembetulan pepijat ChatGPT telah dipertingkatkan dengan banyak:

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Akhirnya, ChatGPT menjawab 31 daripada 40 soalan pada QuixBugs dengan betul.

Netizen mempunyai perasaan bercampur baur

Berkenaan keputusan percubaan sebegitu, netizen mempunyai sikap berbeza terhadap ChatGPT membetulkan pepijat dan memenangi SOTA.

Sesetengah netizen percaya bahawa perkara ini tidak sepatutnya membuatkan pengaturcara berasa krisis, tetapi harus membuatkan mereka berasa gembira.

Implikasinya ialah dengan alatan berguna sedemikian, pengaturcara akan mendapat dua kali ganda hasil dengan separuh usaha.

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Namun, sesetengah orang telah memberikan pandangan yang berbeza tentang perkara ini:

Kerja menjadi lebih mudah tidak bermakna lebih ramai tenaga kerja diperlukan Kurang?

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Tetapi sesetengah netizen merasakan kerja itu tidak berkesudahan:

Walaupun AI boleh memendekkan masa pembangunan dengan susunan magnitud, ia hanya bermakna pengaturcara The kerja seterusnya akan diproses dengan lebih cepat.

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Secara keseluruhannya, ChatGPT pandai membetulkan pepijat dan tidak akan menyebabkan sebarang kemudaratan maut kepada pengaturcara.

Tetapi bagaimana jika kita memberi tumpuan kepada tindakan lain OpenAI?

Perekrutan global dan latihan penyumberan luar ChatGPT untuk menulis kod

Sebelum ini, OpenAI telah menyatakan bahawa salah satu kegunaan penting ChatGPT adalah untuk membantu pengaturcara menyemak kod.

Dalam erti kata lain, ia diletakkan sebagai alat bantu yang tersedia.

Berbanding dengan pandangan bahawa "ChatGPT menimbulkan ancaman", apabila keupayaan ChatGPT berkembang sepenuhnya, pengaturcara tidak perlu lagi takut menulis pepijat.

Pada papan catur yang dibentangkan oleh OpenAI, terdapat lebih daripada sekadar membetulkan pepijat dan mencuri kedudukan pengaturcara menara.

Untuk menjadikannya lebih besar dan kukuh, OpenAI telah didedahkan untuk menyediakan 1,000 jawatan penyumberan luar di Amerika Latin dan Eropah Timur.

Tugas utama pekerja penyumberan luar ialah melabel data dan melatih ChatGPT untuk menulis kod

Daripada 1,000 orang ini, 40% adalah pengaturcara mereka mencipta data untuk model OpenAI dan menggunakannya untuk mempelajari perisian Tugas kejuruteraan.

Sejak sekian lama, data latihan OpenAI telah diambil dari GitHub.

Set data yang dibuat oleh pengaturcara sumber luar pemula sekarang termasuk bukan sahaja baris kod, tetapi juga langkah logik pemikiran manusia di sebalik baris kod.

Seorang pembangun perisian Amerika Selatan mengumumkan bahawa dia telah menyelesaikan ujian pengekodan percuma selama lima jam untuk OpenAI.

Sepanjang proses itu, tugasnya dibahagikan kepada dua bahagian.

Terangkan dalam bahasa Inggeris bertulis cara menangani masalah pengekodan
Sediakan penyelesaian.

Jika pepijat ditemui, OpenAI akan bertanya kepadanya secara terperinci tentang situasi khusus pepijat dan cara membetulkannya.

Pengaturcara perlu menunjukkan setiap langkah berfikir tentang masalah itu, dan dia meneka bahawa OpenAI mungkin mahu menyediakan data latihan yang sangat khusus untuk ChatGPT.

Bekas pengarah AI Tesla Andrej Karpathy mengusik di Twitter:

Bahasa pengaturcaraan popular terkini ialah bahasa Inggeris.

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Tetapi setelah berkata demikian, adalah satu perkara yang baik bahawa ChatGPT mempunyai keupayaan membetulkan pepijat yang kuat, dan ia juga merupakan perkara yang baik jika ia benar-benar boleh berkembang kepada titik di mana ia boleh melengkapkan bahagian hafalan kod.

Lagipun, tujuan OpenAI yang dinyatakan semasa ia diasaskan adalah untuk "memastikan kecerdasan buatan am boleh memberi manfaat kepada semua manusia."

Walaupun pada pandangan pertama, apa yang telah dilakukan selama ini nampaknya agak komited untuk menggunakan usaha sesetengah orang untuk menjadikan lebih ramai orang menganggur.

Daripada menghancurkan manusia di arena Dota2 kepada prestasi cemerlang GPT-3, DALL-E2 dan ChatGPT, produk baharu yang dibawanya sentiasa disertai dengan perbincangan bahawa "xxx akan kehilangan pekerjaannya. "

Tetapi tidak kira apa pun, perniagaan sentiasa menggemarinya.

Buat masa ini, model perniagaan utama OpenAI ialah yuran API, yuran token dan pelesenan perisian.

OpenAI juga baru-baru ini mengeluarkan versi berbayar ChatGPT, ChatGPT Pro, yang berharga AS$42 sebulan (kira-kira RMB 285).

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Walaupun permulaan perbualan robot bermunculan seperti cendawan selepas hujan, terdapat banyak petanda bahawa pasaran terus optimis tentang OpenAI.

Microsoft baru sahaja mengumumkan bahawa ia akan melabur berbilion dolar dalam OpenAI dan menyepadukan model OpenAI ke dalam produk pengguna dan perusahaan seperti Microsoft Bing.

Menurut orang yang biasa dengan perkara itu, jumlah pelaburan tambahan adalah kira-kira AS$10 bilion.

Pada masa yang sama, berita yang didedahkan oleh WSJ menunjukkan bahawa pada awal Januari, Founders Fund, dana modal teroka yang diasaskan oleh bilionair Peter Thiel, sedang berunding untuk melabur dalam OpenAI.

Dilaporkan jumlah pembiayaan akan mencecah sekurang-kurangnya AS$300 juta.

Satu Perkara Lagi

Dalam pusingan pertama percubaan, ChatGPT tidak menyelesaikan masalah bitcount set data QuixBugs.

Tetapi jika anda bertanya soalan ini sekali lagi sekarang, anda akan mendapati bahawa ChatGPT boleh "dilalui semula":

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Jadi adakah ini bermakna ChatGPT mempunyai berubah daripada Adakah anda belajar untuk menyelesaikan masalah semasa penyelidikan ini?

Pautan rujukan:

[1] https://www.php.cn/link/5f5d472067f77b5c88f69f1bcfda1e08
[2] https://www.php. cn/link/8a47481ae534860850adf59f145e6b40
[3] https://www.php.cn/link/7806689d934e610d6600🎜 3 '
https://www.php.cn/link/4271846620d203fd0511c422d483cdbd

Atas ialah kandungan terperinci Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan

Artikel ini dikembalikan pada:51CTO.COM. Jika ada pelanggaran, sila hubungi admin@php.cn Padam

Artikel Berkaitan

Anda mesti membina tempat kerja ai di belakang tudung kejahilanApr 29, 2025 am 11:15 AM

Dalam buku seminal John Rawls pada tahun 1971 The Theory of Justice, beliau mencadangkan percubaan pemikiran yang harus kita ambil sebagai inti reka bentuk AI hari ini dan menggunakan keputusan: tudung kejahilan. Falsafah ini menyediakan alat yang mudah untuk memahami ekuiti dan juga menyediakan pelan tindakan untuk pemimpin untuk menggunakan pemahaman ini untuk mereka bentuk dan melaksanakan AI dengan cara yang saksama. Bayangkan anda membuat peraturan untuk masyarakat baru. Tetapi ada premis: anda tidak tahu terlebih dahulu apa peranan yang akan anda mainkan dalam masyarakat ini. Anda mungkin menjadi kaya atau miskin, sihat atau kurang upaya, milik majoriti atau minoriti marginal. Beroperasi di bawah "VEIL OF KETIGA" ini menghalang pembuat peraturan daripada membuat keputusan yang memberi manfaat kepada diri mereka sendiri. Sebaliknya, orang akan lebih bermotivasi untuk merumuskan orang ramai

Keputusan, Keputusan ... Langkah seterusnya untuk Praktikal Gunaan AIApr 29, 2025 am 11:14 AM

Banyak syarikat yang mengkhususkan diri dalam Automasi Proses Robot (RPA), menawarkan bot untuk mengautomasikan tugas berulang -UIPATH, Automasi di mana sahaja, Prism Blue, dan lain -lain. Sementara itu, proses perlombongan, orkestrasi, dan pemprosesan dokumen pintar Special

Ejen akan datang - lebih banyak mengenai apa yang akan kita lakukan di sebelah rakan kongsi AIApr 29, 2025 am 11:13 AM

Masa depan AI bergerak melampaui ramalan kata mudah dan simulasi perbualan; Ejen AI muncul, mampu tindakan bebas dan penyelesaian tugas. Peralihan ini sudah jelas dalam alat seperti Claude Anthropic. Ejen AI: Penyelidikan a

Mengapa empati lebih penting daripada mengawal pemimpin dalam masa depan yang didorong oleh AIApr 29, 2025 am 11:12 AM

Kemajuan teknologi yang pesat memerlukan perspektif yang berpandangan ke hadapan pada masa depan kerja. Apa yang berlaku apabila AI melampaui peningkatan produktiviti semata -mata dan mula membentuk struktur masyarakat kita? Buku yang akan datang Topher McDougal, Gaia Wakes:

AI untuk Klasifikasi Produk: Bolehkah Mesin Undang -undang Cukai Master?Apr 29, 2025 am 11:11 AM

Klasifikasi produk, sering melibatkan kod kompleks seperti "HS 8471.30" dari sistem seperti sistem harmoni (HS), adalah penting untuk perdagangan antarabangsa dan jualan domestik. Kod ini memastikan permohonan cukai yang betul, memberi kesan kepada setiap inv

Bolehkah Pusat Data menuntut mencetuskan pemulihan teknologi iklim?Apr 29, 2025 am 11:10 AM

Masa Depan Penggunaan Tenaga di Pusat Data dan Pelaburan Teknologi Iklim Artikel ini menerangkan lonjakan penggunaan tenaga di pusat data yang didorong oleh AI dan kesannya terhadap perubahan iklim, dan menganalisis penyelesaian inovatif dan cadangan dasar untuk menangani cabaran ini. Cabaran Permintaan Tenaga: Pusat data besar-besaran dan ultra-besar menggunakan kuasa besar, setanding dengan jumlah beratus-ratus ribu keluarga Amerika Utara yang biasa, dan pusat-pusat skala ultra-besar AI yang muncul menggunakan puluhan kali lebih banyak kuasa daripada ini. Dalam lapan bulan pertama 2024, Microsoft, Meta, Google dan Amazon telah melabur kira -kira AS $ 125 bilion dalam pembinaan dan operasi pusat data AI (JP Morgan, 2024) (Jadual 1). Permintaan tenaga yang semakin meningkat adalah satu cabaran dan peluang. Menurut Canary Media, elektrik yang menjulang

Ai dan Hollywood's Next Golden AgeApr 29, 2025 am 11:09 AM

AI Generatif merevolusi pengeluaran filem dan televisyen. Model Ray 2 Luma, serta Runway's Gen-4, Openai's Sora, Veo Google dan model-model baru yang lain, meningkatkan kualiti video yang dihasilkan pada kelajuan yang belum pernah terjadi sebelumnya. Model-model ini dengan mudah boleh mewujudkan kesan khas yang kompleks dan adegan yang realistik, walaupun klip video pendek dan kesan gerakan yang diperolehi oleh kamera telah dicapai. Walaupun manipulasi dan konsistensi alat -alat ini masih perlu diperbaiki, kelajuan kemajuan adalah menakjubkan. Video generatif menjadi medium bebas. Sesetengah model baik pada pengeluaran animasi, sementara yang lain baik pada imej aksi langsung. Perlu diingat bahawa Firefly Adobe dan Moonvalley's Ma

Adakah Chatgpt perlahan-lahan menjadi Yes-Man terbesar AI?Apr 29, 2025 am 11:08 AM

Pengalaman Pengguna CHATGPT Menolak: Adakah Degradasi Model atau Harapan Pengguna? Baru -baru ini, sebilangan besar pengguna berbayar ChatGPT telah mengadu tentang kemerosotan prestasi mereka, yang telah menarik perhatian yang meluas. Pengguna melaporkan tindak balas yang lebih perlahan terhadap model, jawapan yang lebih pendek, kekurangan bantuan, dan lebih banyak halusinasi. Sesetengah pengguna menyatakan rasa tidak puas hati di media sosial, menunjukkan bahawa ChatGPT telah menjadi "terlalu menyanjung" dan cenderung untuk mengesahkan pandangan pengguna dan bukannya memberikan maklum balas kritikal. Ini bukan sahaja memberi kesan kepada pengalaman pengguna, tetapi juga membawa kerugian sebenar kepada pelanggan korporat, seperti mengurangkan produktiviti dan pembaziran sumber pengkomputeran. Bukti kemerosotan prestasi Ramai pengguna telah melaporkan kemerosotan yang ketara dalam prestasi CHATGPT, terutamanya dalam model yang lebih lama seperti GPT-4 (yang tidak lama lagi akan dihentikan dari perkhidmatan pada akhir bulan ini). ini

See all articles

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Tunjukkan Lagi

Artikel Panas

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

3 minggu yang laluByDDD

Bagaimana untuk memperbaiki KB5055523 gagal dipasang di Windows 11?

2 minggu yang laluByDDD

Inzoi: Cara Memohon ke Sekolah dan Universiti

4 minggu yang laluByDDD

Bagaimana untuk memperbaiki KB5055518 gagal dipasang di Windows 10?

2 minggu yang laluByDDD

Roblox: Rails Dead - Cara Memanggil dan Mengalahkan Nikola Tesla

4 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Muat turun versi mac editor Atom

Editor sumber terbuka yang paling popular

EditPlus versi Cina retak

Saiz kecil, penyerlahan sintaks, tidak menyokong fungsi gesaan kod

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat ialah persekitaran pelayar selamat untuk mengambil peperiksaan dalam talian dengan selamat. Perisian ini menukar mana-mana komputer menjadi stesen kerja yang selamat. Ia mengawal akses kepada mana-mana utiliti dan menghalang pelajar daripada menggunakan sumber yang tidak dibenarkan.

Penyesuai Pelayan SAP NetWeaver untuk Eclipse

Integrasikan Eclipse dengan pelayan aplikasi SAP NetWeaver.

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7831

1648

1402

1300

1239