Rumah  >  Artikel  >  Peranti teknologi  >  Ia benar-benar bukan Versailles! ChatGPT begitu berjaya, malah OpenAI tidak memahaminya

Ia benar-benar bukan Versailles! ChatGPT begitu berjaya, malah OpenAI tidak memahaminya

WBOY
WBOYke hadapan
2023-04-11 21:34:051550semak imbas

Syarikat ini telah membuat produk yang mungkin mencetuskan revolusi perindustrian keempat, tetapi mereka hairan: mengapa produk mereka begitu popular?

Ia sebenarnya bukan Versailles.

Baru-baru ini, MIT Technology Review telah menemu bual beberapa pembangun ChatGPT, memberikan kami pandangan lebih dekat tentang kisah di sebalik produk AI yang meletup ini.

Ia sangat popular sehingga tiada persediaan langsung

Apabila OpenAI melancarkan ChatGPT secara senyap-senyap pada akhir November 2022, syarikat permulaan tidak mempunyai jangkaan yang tinggi.

Kakitangan OpenAI tidak pernah menyangka bahawa model mereka akan berada di landasan untuk menjadi model terkemuka.

SembangGPT nampaknya menjadi popular dalam sekelip mata, mencetuskan serangan emas global untuk model bahasa besar Walau bagaimanapun, OpenAI tidak bersedia sama sekali dan hanya boleh tergesa-gesa untuk mengejar Follow teratasnya sendiri jejak langkah model aliran dan cuba merebut peluang perniagaan.

Sandhini Agarwal, yang bekerja pada dasar di OpenAI, berkata bahawa dalam OpenAI, ChatGPT sentiasa dianggap sebagai "pratonton penyelidikan" - ia adalah versi teknologi yang lebih lengkap daripada dua tahun yang lalu. Lebih-lebih lagi, syarikat itu cuba memperbaiki beberapa kelemahan model melalui maklum balas orang ramai.

Siapa sangka produk "pratonton" sebegitu akan menjadi popular selepas kemunculannya secara tidak sengaja.

Para saintis OpenAI sangat keliru tentang perkara ini, dan mereka juga sangat jelas tentang bunga dan tepukan dari dunia luar.

“Kami tidak mahu membesar-besarkan perkara ini sebagai kemajuan asas yang besar,” kata Liam Fedus, seorang saintis OpenAI yang mengambil bahagian dalam pembangunan ChatGPT.

Ia benar-benar bukan Versailles! ChatGPT begitu berjaya, malah OpenAI tidak memahaminya

5 daripada ahli pasukan ChatGPT telah dinamakan AI 2000 Global Artificial Intelligence Scholars pada tahun 2023

Untuk tujuan ini, wartawan MIT Technology Review Will Douglas Heaven menemu bual pengasas bersama OpenAI John Schulman, pemaju Agarwal dan Fedus, dan Jan Leike, ketua pasukan penjajaran.

Kami tidak faham mengapa ChatGPT begitu popular

Pengasas John Schulman berkata bahawa beberapa hari selepas ChatGPT dikeluarkan, dia akan Melayari Twitter. Terdapat satu tempoh yang gila apabila suapan Twitter dipenuhi dengan tangkapan skrin ChatGPT.

Dia berpendapat bahawa ini adalah produk yang sangat intuitif untuk pengguna, dan dia juga berpendapat bahawa ia akan mempunyai beberapa peminat, tetapi dia tidak menjangka ia akan menjadi arus perdana.

Jan Leike berkata bahawa segala-galanya begitu mendadak dan semua orang terkejut dan bergelut untuk bersaing dengan rentak letupan ChatGPT. Dia ingin tahu apa yang mendorong popularitinya yang melonjak. Adakah seseorang di belakang tabir? Lagipun, OpenAI sendiri tidak dapat mengetahui mengapa ChatGPT begitu popular.

Ia benar-benar bukan Versailles! ChatGPT begitu berjaya, malah OpenAI tidak memahaminya

Liam Fedus menjelaskan mengapa mereka begitu terkejut, kerana ChatGPT bukanlah bot sembang tujuan umum yang pertama sudah mencubanya, jadi Liam Fedus berpendapat peluang mereka tidak besar. Walau bagaimanapun, versi beta peribadi juga memberikan keyakinan kepadanya - mungkin, A ini adalah sesuatu yang sangat disukai pengguna.

Sandhini Agarwal menyimpulkan bahawa kejayaan serta-merta ChatGPT adalah satu kejutan untuk semua orang. Banyak kerja telah dilakukan pada model ini sehingga kita lupa betapa menakjubkannya model tersebut kepada orang awam di luar syarikat.

Memang, kebanyakan teknologi dalam ChatGPT bukanlah baharu. Ia adalah versi GPT-3.5 yang diperhalusi, yang dikeluarkan OpenAI beberapa bulan sebelum ChatGPT. GPT-3.5 sendiri adalah versi terkini GPT-3, yang muncul pada tahun 2020.

Ia benar-benar bukan Versailles! ChatGPT begitu berjaya, malah OpenAI tidak memahaminya

Pasukan ChatGPT telah mengambil bahagian dalam tujuh nombor R&D teknologi sebelum ini

Di tapak web OpenAI menyediakan model ini dalam bentuk antara muka pengaturcaraan aplikasi atau API, dan pembangun lain boleh dengan mudah memasukkan model ke dalam kod mereka sendiri.

Pada Januari 2022, OpenAI turut mengeluarkan InstructGPT, versi GPT-3.5 yang diperhalusi sebelumnya. Walau bagaimanapun, teknologi ini tidak dipromosikan kepada orang ramai.

Proses penalaan halus

Menurut Liam Fedus, model ChatGPT diperhalusi daripada model bahasa yang sama seperti InstructGPT, menggunakan fine -tala Kaedah adalah serupa. Para penyelidik menambah beberapa data perbualan dan membuat beberapa pelarasan pada proses latihan. Jadi mereka tidak mahu membesar-besarkan ia sebagai kemajuan asas yang besar.

Ternyata yang memainkan peranan besar dalam ChatGPT ialah data perbualan.

Menurut penilaian penanda aras standard, sebenarnya tiada perbezaan besar dalam keupayaan teknikal mentah antara kedua-dua model Perbezaan terbesar antara ChatGPT ialah ia lebih mudah diperoleh dan digunakan.

Jan Leike menjelaskan bahawa dari satu segi, ChatGPT boleh difahami sebagai versi sistem AI yang dimiliki OpenAI sejak sekian lama. ChatGPT tidak lebih berkemampuan. Sebelum kemunculan ChatGPT, model asas yang sama telah digunakan pada API selama hampir setahun.

Peningkatan penyelidik boleh diringkaskan sebagai, dalam erti kata lain, menjadikannya lebih selaras dengan perkara yang manusia mahu lakukan dengannya. Ia bercakap dengan pengguna dalam perbualan, ialah antara muka sembang, dan mudah diakses. Ia menjadikannya lebih mudah untuk membuat kesimpulan niat dan pengguna boleh melakukan percubaan berulang-alik untuk mencapai perkara yang mereka inginkan.

Rahsianya ialah teknologi Peneguhan Pembelajaran dengan Maklum Balas Manusia (RLHF), yang hampir sama dengan kaedah latihan InstructGPT - mengajarnya perkara yang sebenarnya disukai oleh pengguna manusia.

Jan Leike berkata bahawa mereka meminta sekumpulan besar orang untuk membaca gesaan dan respons ChatGPT, kemudian memilih antara dua respons untuk melihat respons yang semua orang fikirkan lebih baik. Semua data ini kemudiannya digabungkan menjadi satu sesi latihan.

Ia benar-benar bukan Versailles! ChatGPT begitu berjaya, malah OpenAI tidak memahaminya

Sebahagian besarnya adalah sama seperti yang mereka lakukan pada InstructGPT. Seperti anda harap ia membantu, anda harap ia benar, anda harap ia tidak ganas.

Terdapat juga beberapa butiran Sebagai contoh, jika pertanyaan pengguna tidak jelas, ia harus bertanya soalan susulan untuk memperhalusinya. Ia juga harus menjelaskan bahawa ia adalah sistem kecerdasan buatan dan tidak sepatutnya menganggap identiti yang tidak dimilikinya atau mendakwa mempunyai keupayaan yang tidak dimilikinya. Apabila pengguna memintanya melakukan tugas yang tidak sepatutnya dilakukan, ia mesti menolak secara jelas.

Iaitu, terdapat senarai pelbagai kriteria yang perlu diberi penilaian oleh manusia untuk menentukan kedudukan model, seperti keaslian. Tetapi mereka juga akan memilih amalan tertentu, seperti AI tidak berpura-pura menjadi manusia.

Bersedia untuk keluaran

Secara amnya, ChatGPT menggunakan teknologi yang telah digunakan OpenAI, jadi pasukan tidak melakukan apa-apa semasa bersiap sedia untuk mengeluarkan model ini kepada umum. Apa sahaja yang istimewa. Pada pandangan mereka, piawaian yang ditetapkan untuk model terdahulu adalah mencukupi dan GPT-3.5 cukup selamat.

Dalam latihan ChatGPT tentang keutamaan manusia, ia mempelajari tingkah laku penolakan dengan sendirinya dan menolak banyak permintaan.

OpenAI mengumpulkan beberapa "penyanyi" untuk ChatGPT: semua orang dalam syarikat itu duduk dan cuba memecahkan model itu. Ada juga kumpulan luar melakukan perkara yang sama. Pengguna awal yang dipercayai juga memberikan maklum balas.

Sandhini Agarwal berkata bahawa mereka mendapati bahawa ia menghasilkan beberapa output yang tidak diingini, tetapi ini adalah perkara yang juga dihasilkan oleh GPT-3.5. Oleh itu, jika kita hanya melihat kepada risiko, ChatGPT sudah cukup bagus sebagai "research preview".

John Schulman juga berkata bahawa adalah mustahil untuk menunggu sehingga sistem 100% sempurna sebelum mengeluarkannya. Mereka telah menguji versi awal beta selama beberapa bulan dan penguji beta sangat kagum dengan ChatGPT.

Apa yang paling dibimbangkan oleh OpenAI sebenarnya adalah isu fakta, kerana ChatGPT terlalu suka mengada-adakan perkara. Tetapi masalah ini wujud dalam InstructGPT dan model bahasa besar yang lain, jadi pada pandangan penyelidik, selagi ChatGPT lebih baik daripada model mengenai fakta dan isu keselamatan lain, ia sudah memadai.

Menurut penilaian terhad, sebelum dikeluarkan, boleh disahkan bahawa ChatGPT lebih realistik dan lebih selamat daripada model lain, oleh itu, OpenAI memutuskan untuk meneruskan keluaran.

Maklum balas selepas keluaran

Selepas ChatGPT dikeluarkan, OpenAI telah memerhatikan cara pengguna menggunakannya.

Ini adalah kali pertama dalam sejarah model bahasa yang besar telah diletakkan di tangan berpuluh juta pengguna.

Pengguna juga menjadi gila dan ingin menguji had ChatGPT dan di mana pepijat berada.

Ia benar-benar bukan Versailles! ChatGPT begitu berjaya, malah OpenAI tidak memahaminya

Kepopularan ChaatGPT juga telah menyebabkan banyak masalah timbul, seperti isu berat sebelah dan masalah yang disebabkan melalui gesaan.

Jan Leike berkata bahawa beberapa perkara yang menjadi tular di Twitter sebenarnya telah dijaga secara senyap oleh OpenAI.

Sebagai contoh, isu pemecahan jail pastinya sesuatu yang perlu mereka selesaikan. Pengguna hanya ingin mencuba untuk membuat model mengatakan perkara yang buruk melalui beberapa kelainan dan selekoh Ini adalah dalam jangkaan OpenAI dan juga satu-satunya cara untuk pergi.

Apabila jailbreak ditemui, OpenAI akan menambahkan syarat ini pada data latihan dan ujian, dan semua data akan dimasukkan ke dalam model masa hadapan.

Ia benar-benar bukan Versailles! ChatGPT begitu berjaya, malah OpenAI tidak memahaminya

Jan Leike berkata apabila terdapat model yang lebih baik, mereka akan mahu mengeluarkannya dan mengujinya.

Mereka sangat optimistik bahawa beberapa latihan lawan yang disasarkan boleh memperbaiki keadaan jailbreak dengan banyak. Walaupun tidak jelas sama ada masalah ini akan hilang sepenuhnya, mereka percaya ia boleh menyukarkan banyak jailbreak.

Apabila sistem "debut secara rasmi", sukar untuk meramalkan segala-galanya yang sebenarnya akan berlaku.

Jadi mereka hanya boleh menumpukan pada pemantauan untuk kegunaan orang menggunakan sistem, melihat apa yang berlaku dan kemudian bertindak balas terhadapnya.

Ia benar-benar bukan Versailles! ChatGPT begitu berjaya, malah OpenAI tidak memahaminya

Kini, Microsoft telah melancarkan Bing Chat, yang difikirkan oleh ramai orang sebagai versi rasmi OpenAI GPT-4 yang belum diumumkan.

Di bawah premis ini, Sandhini Agarwal berkata apa yang mereka hadapi sekarang pastinya jauh lebih tinggi berbanding enam bulan lalu, tetapi masih lebih rendah daripada tahap setahun kemudian.

Konteks di mana model ini digunakan adalah amat penting.

Bagi syarikat besar seperti Google dan Microsoft, walaupun satu perkara tidak benar, ia menjadi masalah besar kerana mereka adalah enjin carian sendiri.

Ia benar-benar bukan Versailles! ChatGPT begitu berjaya, malah OpenAI tidak memahaminya

Paul Buchheit, pekerja ke-23 Google, yang mengasaskan Gmail, bersikap pesimis terhadap Google

Model bahasa besar sebagai enjin carian , yang sepenuhnya berbeza dengan chatbot hanya untuk keseronokan. Penyelidik OpenAI juga bekerja keras untuk memikirkan cara untuk beralih antara kegunaan yang berbeza dan mencipta sesuatu yang benar-benar berguna kepada pengguna.

John Schulman mengakui OpenAI memandang rendah betapa ramai orang mengambil berat tentang isu politik dalam ChatGPT. Untuk tujuan ini, mereka berharap dapat membuat keputusan yang lebih baik apabila mengumpul data latihan untuk mengurangkan masalah dalam bidang ini.

Jan Leike berkata dari sudut pandangannya sendiri, ChatGPT sering gagal. Terdapat begitu banyak masalah yang perlu diselesaikan, tetapi OpenAI tidak menyelesaikannya. Ini, dia mengaku terus terang.

Walaupun model bahasa telah lama wujud, ia masih di peringkat awal.

Seterusnya, OpenAI perlu melakukan lebih banyak perkara.

Atas ialah kandungan terperinci Ia benar-benar bukan Versailles! ChatGPT begitu berjaya, malah OpenAI tidak memahaminya. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam