Rumah > Artikel > Peranti teknologi > Pengaturcara berada dalam bahaya! Dikatakan bahawa OpenAI merekrut tentera penyumberan luar secara global dan melatih petani kod ChatGPT langkah demi langkah
Pengekod benar-benar dalam bahaya!
Baru-baru ini, terdapat berita bahawa OpenAI telah melatih ChatGPT secara senyap-senyap untuk membiarkannya mempelajari proses pemikiran manusia, dengan itu benar-benar menguasai kejuruteraan perisian dan menggantikan sepenuhnya "pengekod junior".
Beberapa syarikat utama Silicon Valley sedang mengusahakan AI yang boleh memprogram.
AlphaCode DeepMind dikatakan "menewaskan 72% pengaturcara manusia", tetapi ia masih belum dibuka "projek misteri" Google Pitchfork juga masih dalam proses pembuatan dan Microsoft GitHub Copilot; terutamanya alat Penyiapan kod.
Untuk menggantikan sepenuhnya pengekod manusia, mereka tidak layak.
Tetapi jika ChatGPT benar-benar belajar menggunakan pemikiran manusia untuk memprogram, rakan-rakan/produk sendiri ini mungkin akan dikalahkan.
Dari semua petunjuk, OpenAI nampaknya sedang bermain permainan besar.
Menurut Semafor, dalam tempoh enam bulan lalu, OpenAI telah merekrut kira-kira 1,000 kakitangan penyumberan luar dari wilayah seperti Amerika Latin dan Eropah Timur untuk melatih kod AI mereka.
Terdapat dua "titik indah" dalam berita ini.
Pertama sekali, mengapa lokasi dipilih di Amerika Latin dan Eropah Timur? Kita semua tahu ini. Sekarang gelembung Lembah Silikon telah pecah, syarikat Internet utama memeras otak mereka untuk "mengurangkan kos dan meningkatkan kecekapan, sesetengahnya bergantung pada pemberhentian pekerja, sementara yang lain pergi ke negara lain untuk mencari buruh murah."
"titik hua" kedua ialah ramai daripada penyumber luar ini bukan graduan sains komputer, dan mereka juga tidak mempunyai kemahiran pengaturcaraan lanjutan. Peranan mereka adalah untuk menulis kod asas untuk "automasi" yang OpenAI harap dapat dicapai.
Secara khusus, 60% daripada mereka terlibat dalam kerja "anotasi data" - mencipta sejumlah besar imej, klip audio dan maklumat lain untuk melatih alatan kecerdasan buatan atau kereta pandu sendiri.
40% yang lain adalah pengaturcara sebenar, yang sedang "menggosok tangan" data untuk model OpenAI supaya AI boleh mempelajari tugas kejuruteraan perisian.
Sebelum ini, OpenAI telah melatih modelnya dengan kod yang diambil daripada GitHub.
Kali ini, set data yang OpenAI mahu bina bukan sahaja mengandungi kod, tetapi juga termasuk penjelasan manusia yang ditulis dalam bahasa semula jadi di belakangnya.
Alamat kertas: https://arxiv.org/abs/2107.03374
Dalam hal ini, Semafor menemu bual khas seorang pemaju Amerika Selatan, dan Dia pernah menyelesaikan ujian pengekodan selama 5 jam untuk OpenAI secara percuma.
Dalam ujian ini, dia diminta mengendalikan dua tugasan.
Pertama, dia diberi masalah pengaturcaraan dan OpenAI memintanya menerangkan dalam bahasa Inggeris bertulis bagaimana dia akan menangani masalah itu.
Kemudian, dia perlu menyediakan penyelesaian.
Jika dia menjumpai pepijat, OpenAI akan memintanya untuk menerangkan secara terperinci apa masalah itu dan cara ia harus dibetulkan, bukannya hanya membetulkannya.
"Mereka mungkin mahu menggunakan jenis data latihan yang sangat istimewa untuk menyuap model ini. Dalam kes ini, mereka perlu menunjukkan cara manusia berfikir langkah demi langkah."
Dalam ChatGPT sebelum ini, banyak masalah ditemui dalam kod yang ditulis.
Sebabnya ChatGPT tidak mempunyai sebarang rekod dalaman yang menandakan betul atau salah Ia sebenarnya model statistik. Jawapan ChatGPT pada asasnya adalah hasil probabilistik yang diperoleh daripada korpus data Internet yang membentuk GPT-3.
OpenAI juga berkata pada masa itu bahawa kedudukan ChatGPT yang paling sesuai haruslah alat bantuan pengekodan.
Tetapi bayangkan jika OpenAI benar-benar mengajar ChatGPT untuk "berfikir langkah demi langkah seperti manusia", maka ia boleh menggantikan sepenuhnya beberapa kerja pengekodan yang memerlukan hafalan hafalan bahawa beberapa pengekod "junior" dihapuskan sepenuhnya.
Kini, eksekutif Silicon Valley membayangkan produk yang membolehkan orang yang mempunyai sedikit pengalaman pengaturcaraan untuk menerangkan idea dan visi mereka kepada AI, dan kemudian boleh membina apa sahaja yang mereka mahu, sama ada laman web itu masih merupakan permainan.
Beberapa hari lalu, Andrej Karpathy, bekas ketua kecerdasan buatan Tesla, baru sahaja berkata di Twitter: "Bahasa pengaturcaraan baharu yang paling hangat ialah bahasa Inggeris."
Ini mungkin bukan jenaka, contohnya, ChatGPT yang popular mempunyai potensi yang besar.
Baru-baru ini, kajian dari University of Mainz dan University College London mendapati bahawa ChatGPT bukan sahaja melakukan kerja yang sangat baik untuk membetulkan pepijat, tetapi pembangun juga boleh meningkatkan kadar kejayaan mereka dengan ketara melalui perbualan.
Penyelidik menyatakan bahawa prestasi penyahpepijatan ChatGPT adalah hampir sama dengan kaedah pembelajaran mendalam biasa CoCoNut dan Codex, dan jauh lebih baik daripada kaedah pembaikan program automatik standard (APR).
Alamat kertas: https://arxiv.org/abs/2301.08653
Menggunakan ChatGPT untuk menyelesaikan masalah kod bukanlah perkara baru, tetapi bercakap dengan manusia Unik keupayaan yang memberikan kelebihan berbanding kaedah dan model lain.
Untuk menilai prestasi penyahpepijatan ChatGPT, penyelidik mengujinya menggunakan 40 masalah Python tulen penanda aras QuixBugs dan kemudian menyemak secara manual sama ada penyelesaian yang dicadangkan adalah betul.
Memandangkan terdapat tahap rawak tertentu dalam jawapan yang diberikan oleh ChatGPT, penyelidik menguji setiap soalan sebanyak 4 kali secara individu.
Tidak seperti tanda aras pembaikan program automatik lain, QuixBugs mengandungi masalah yang agak kecil (kurang baris kod), yang sesuai untuk digunakan dalam sistem perbualan.
Semasa ujian, penyelidik mengalih keluar semua ulasan dan bertanya kepada ChatGPT jika kod ini mempunyai pepijat dan cara membetulkannya.
Sebagai contoh, Rajah 1 ialah contoh masalah BITCOUNT. Antaranya, baris 1-2 adalah permintaan untuk ChatGPT bermula dari baris 4 adalah coretan kod yang salah.
Untuk contoh ini, kami berharap jawapan ChatGPT akan membetulkan ralat pada baris 7, iaitu nˆ= n - 1 harus digantikan dengan n &= n - 1. Sebagai tindak balas, ChatGPT sama ada akan menyediakan sekeping kod tetap atau penerangan tentang cara kami harus mengubah suainya.
Hasilnya menunjukkan bahawa ChatGPT menyelesaikan 19 daripada 40 pepijat, yang setanding dengan CoCoNut (19) dan Codex (21), tetapi kaedah APR standard hanya menyelesaikan 19 daripada mereka 7 soalan.
Sudah tentu, memandangkan ChatGPT dan Codex kedua-duanya daripada siri model bahasa yang sama, maka tidak hairanlah bilangan masalah yang diselesaikan hampir sama.
Selain itu, jika kita melihat dengan teliti pada keputusan, kita juga boleh mendapati bahawa ChatGPT tidak menyelesaikan pepijat dalam penanda aras setiap kali. Hanya pada dua isu BUCKETSORT dan FLATTEN, pepijat ditemui empat kali, manakala yang lain biasanya hanya berjaya 1-2 kali.
Dalam erti kata lain, pengguna mungkin perlu mencuba beberapa kali untuk mendapatkan hasil yang betul apabila benar-benar menggunakannya.
Walau bagaimanapun, ChatGPT mempunyai kelebihan yang hebat: kita boleh berinteraksi dengan sistem semasa perbualan, menerangkan soalan dengan lebih terperinci dan mendapatkan jawapan yang betul.
Keputusan ujian sebenar memang sama.
Selepas dialog lanjut dengan model, para penyelidik berjaya menyegarkan semula ketepatan ChatGPT kepada 77.5%, yang bermaksud bahawa 31 daripada 40 ralat telah diperbaiki, jauh melebihi SOTA.
Sekurang-kurangnya, buat masa ini, nampaknya mungkin sepenuhnya: pembangun tidak perlu lagi menulis kod boilerplate.
Sebaliknya, mereka boleh memfokuskan pada bidang seperti seni bina aplikasi kompleks atau keselamatan rangkaian.
Maksudnya, walaupun ChatGPT mungkin melakukan beberapa kerja pengaturcaraan, seperti menulis fungsi biasa atau kod boilerplate, ia tidak akan menggantikan pengaturcara sepenuhnya. Kerana tugas seorang pengaturcara memerlukan lebih daripada sekadar menulis kod.
Menjadi pengaturcara memerlukan kemahiran—keupayaan untuk membina atur cara, mengikut logik dan menghasilkan sesuatu yang lebih besar daripada jumlah bahagiannya.
Jelas sekali, ChatGPT bukanlah produk "lelaran kendiri" pertama yang dibuat oleh pengekod.
Mari kita selaraskan barisan AI yang boleh menulis kod.
Google's Pitchfork
November lalu, terdapat khabar angin bahawa Google sedang membuat projek rahsia Produk ini akan menggunakan pembelajaran mesin untuk melatih kod, memprogramkan dirinya sendiri dan membaiki sendiri pepijat dan boleh dikemas kini sendiri.
Menurut orang yang biasa dengan perkara itu, projek ini pada asalnya dibangunkan oleh unit pendaratan bulan Alphabet, bahagian X, dengan nama kod Pitchfork dan telah dipindahkan ke Google Labs lepas musim panas.
Menurut maklumat dalaman, peranan Pitchfork adalah untuk "mengajar kod untuk menulis dan menulis semula sendiri."
Ia boleh mempelajari gaya pengaturcaraan yang berbeza dan menulis kod mengikut gaya ini.
Seorang pekerja Google berkata bahawa niat asal membangunkan Pitchfork adalah untuk membina alat untuk mengemas kini pangkalan kod Python Google kepada versi baharu.
AlphaCode: Menewaskan 72% pengaturcara
Pada Februari 2022, DeepMind melancarkan sistem "AlphaCode", yang boleh menggunakan kecerdasan buatan untuk menjana kod.
Menurut DeepMind, AlphaCode boleh menyaingi manusia.
DeepMind menguji AlphaCode menggunakan 10 pertandingan sedia ada yang dihoskan pada platform pertandingan pengaturcaraan Codeforces, dan ia menduduki tempat teratas 54.3% keseluruhan, bermakna ia mengalahkan 46 % peserta.
DeepMind mendakwa bahawa AlphaCode menyelesaikan 34.2% masalah dalam 1 juta sampel apabila diuji menggunakan platform pertandingan pengaturcaraan Codeforces.
Selain itu, antara pengguna yang menyertai pertandingan dalam tempoh 6 bulan yang lalu, data AlphaCode berada di kedudukan 28% teratas, yang boleh dikatakan "mengalahkan 72% pengaturcara manusia”!
Pada masa itu, DeepMind menegaskan bahawa walaupun AlphaCode pada masa ini hanya sesuai untuk bidang pengaturcaraan yang kompetitif, adalah jelas bahawa keupayaan masa depannya tidak akan berhenti di situ.
Ia membuka pintu kepada penciptaan alatan yang akan menjadikan pengaturcaraan lebih mudah diakses dan suatu hari nanti automatik sepenuhnya.
Copilot: Artifak pelengkap kod
Melangkah ke hadapan, pada tahun 2021, GitHub dan OpenAI bersama-sama melancarkan artifak pengaturcaraan AI-GitHub Copilot.
Apabila anda memasukkan kod, Copilot akan secara automatik menggesa coretan kod yang mungkin muncul seterusnya dalam program, sama seperti robot autolengkap yang dilatih untuk bercakap dalam Python atau JavaScript.
Copilot boleh mengisi blok kod yang diperlukan, selagi ia tidak terlalu rumit atau kreatif, yang sangat berguna untuk pengaturcaraan yang sama dengan kerja manual.
Pada 22 Jun 2022, Copilot telah dilancarkan secara rasmi untuk bahagian C, berharga AS$10/bulan atau AS$100/tahun, dan diberikan secara percuma kepada pengguna pelajar dan penyelenggara projek sumber terbuka yang popular.
Copilot kini digunakan oleh beribu-ribu pembangun. Sehingga 40% kod yang ditulis dalam sedozen bahasa paling popular bergantung padanya untuk menjana kod.
GitHub meramalkan bahawa pembangun akan menggunakan Copilot untuk menulis sehingga 80% kod mereka dalam tempoh lima tahun.
Ketua Pegawai Teknologi Microsoft Kevin Scott juga berkata: "Kami yakin bahawa Copilot GitHub boleh digunakan untuk beribu-ribu jenis kerja yang berbeza
Namun, disebabkan dakwaan pelanggaran, ia tidak boleh digunakan." dibebaskan sebelum Lima bulan kemudian, Copilot telah disaman oleh pengaturcara yang marah untuk $9 bilion.
Bolehkah ChatGPT, yang telah mempelajari "pemikiran kejuruteraan perisian", mengalahkan mereka? Pada kadar OpenAI, saya khuatir kita tidak perlu menunggu terlalu lama.
https://www.semafor.com/article/01/27/2023/openai-telah-upah-tentera-kontraktor-untuk-buat- basic-coding-usang
https://www.zdnet.com/article/chatgpt-can-write-code-now-researchers-say-its-good-at-fixing-bugs-too/
Atas ialah kandungan terperinci Pengaturcara berada dalam bahaya! Dikatakan bahawa OpenAI merekrut tentera penyumberan luar secara global dan melatih petani kod ChatGPT langkah demi langkah. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!