cari
RumahPeranti teknologiAIKetahui dengan cepat perkara teknikal utama kertas InstructGPT: ikuti Li Mu untuk menguasai teknologi di sebalik ChatGPT

Selepas ChatGPT menjadi popular, ramai pelajar yang meminati teknologi bertanyakan soalan: Adakah terdapat bahan pembelajaran yang membolehkan kita memahami secara sistematik prinsip di sebalik ChatGPT? Masalah ini menjadi rumit kerana OpenAI belum mengeluarkan kertas kerja berkaitan ChatGPT.

Walau bagaimanapun, kami tahu dari blog OpenAI tentang ChatGPT bahawa kaedah yang digunakan oleh ChatGPT adalah sama dengan model saudaranya-InstructGPT, kecuali InstructGPT diperhalusi pada GPT-3 , manakala ChatGPT adalah berdasarkan GPT-3.5. Terdapat juga beberapa perbezaan antara keduanya dari segi pengumpulan data.

Ketahui dengan cepat perkara teknikal utama kertas InstructGPT: ikuti Li Mu untuk menguasai teknologi di sebalik ChatGPT

Pautan blog: https://openai.com/blog/chatgpt/

Kertas InstructGPT telah dikeluarkan pada Mac 2022, tetapi OpenAI menerbitkan blog berkaitan seawal Januari (lihat "Apa yang perlu dilakukan dengan karut GPT-3? OpenAI: Kami melatihnya semula" , versi baharu lebih "taat"). Pada masa itu, OpenAI dengan jelas menyebut bahawa InstructGPT menggunakan kaedah pembelajaran pengukuhan maklum balas manusia (RLHF) untuk memperhalusi GPT-3, menjadikan output model lebih konsisten dengan pilihan manusia Ini telah diteruskan dalam latihan ChatGPT.

Ketahui dengan cepat perkara teknikal utama kertas InstructGPT: ikuti Li Mu untuk menguasai teknologi di sebalik ChatGPT

Pautan kertas: https://arxiv.org/pdf/2203.02155.pdf

Selain itu, terdapat banyak persamaan antara InstructGPT dan ChatGPT. Oleh itu, pemahaman yang menyeluruh tentang kertas InstructGPT akan memberi manfaat yang besar kepada pelajar yang ingin melakukan beberapa kerja ke arah ChatGPT. Itulah sebabnya kami sangat mengesyorkan kuliah Li Mu.

Ketahui dengan cepat perkara teknikal utama kertas InstructGPT: ikuti Li Mu untuk menguasai teknologi di sebalik ChatGPT

Alamat kursus: https://jmq.xet.tech/s/2lec6b (Klik "Baca Teks asal" boleh diakses terus)

Dr. Li Mu ialah ketua saintis kanan di Amazon. Beliau sebelum ini mengarang bersama "Hands-on Deep Learning" dengan Aston Zhang dan lain-lain. Dalam dua tahun yang lalu, beliau telah memperkenalkan pelbagai pengetahuan AI kepada semua orang melalui video dan menghasilkan kursus membaca intensif pada berpuluh-puluh kertas kerja. Ramai pelajar telah mengembangkan tabiat membaca kertas secara intensif dengan Li Mu.

Akaun Dr Li Mu di Stesen B ialah “Belajar AI daripada Li Mu”.

Kursus tafsiran untuk InstructGPT ini mengambil masa selama 67 minit, dan pada asasnya diperkenalkan mengikut urutan penulisan kertas kerja.

Ketahui dengan cepat perkara teknikal utama kertas InstructGPT: ikuti Li Mu untuk menguasai teknologi di sebalik ChatGPT

Pelajar yang telah membaca blog ChatGPT tahu bahawa prinsip teknikalnya pada asasnya boleh diringkaskan dalam satu gambar juga gambar yang telah muncul dalam kertas InstructGPT (terdapat perbezaan halus antara keduanya). Apabila mentafsir abstrak dan pengenalan kertas, Li Mu memperkenalkan tiga langkah dalam rajah secara terperinci.

Ketahui dengan cepat perkara teknikal utama kertas InstructGPT: ikuti Li Mu untuk menguasai teknologi di sebalik ChatGPT

Skema teknikal dari blog ChatGPT.

Ketahui dengan cepat perkara teknikal utama kertas InstructGPT: ikuti Li Mu untuk menguasai teknologi di sebalik ChatGPT

Skema teknikal daripada kertas InstructGPT.

Dalam bab ketiga kertas kerja, pengarang InstructGPT mula-mula memperkenalkan kaedah dan proses pemerolehan data mereka, dan Li Mu turut membawa semua orang membacanya secara terperinci. Bahagian ini sangat berharga dalam kejuruteraan. Seperti yang dikatakan Li Mu, jika anda tidak pernah melakukan perkara seperti ini sebelum ini (pelabelan data, dsb.) dan perlu mencari seseorang untuk membantu anda melabel data, maka anda boleh melihat lampirannya, yang mengandungi banyak templat yang boleh digunakan secara langsung. Pengarang makalah Ia juga menerangkan rupa UI tapak web beranotasi mereka, yang patut dipelajari.

Seterusnya, Li Mu menumpukan perhatian kepada tiga model yang ditulis dalam Bab 3 (lihat Model 3.5) - model SFT (Penalaan halus diselia), model RM (Pemodelan ganjaran) dan RL (Pembelajaran pengukuhan)), termasuk butiran seperti parameter dan fungsi objektif yang terlibat dalam model ini.

Akhirnya, Li Mu membuat kesimpulan bahawa dari segi teknikal, InstructGPT masih merupakan teknologi yang sangat praktikal. Ia memberitahu semua orang satu kaedah: memandangkan model bahasa yang besar, bagaimana anda boleh meningkatkan prestasinya dengan cepat dalam bidang yang anda minati melalui beberapa data beranotasi untuk menjadikannya praktikal. Oleh itu, ia menyediakan idea operasi untuk orang yang ingin menggunakan model generatif untuk membuat produk.

Sudah tentu, seperti yang dikatakan oleh Dr. Li Mu, kerja penyelidikan saintifik adalah langkah demi langkah, dan InstructGPT juga berdasarkan penyelidikan terdahulu, jadi pelajar yang ingin memahami sepenuhnya ChatGPT akan tidak dapat tidak perlu kembali dan membacanya. Dalam kursus sebelumnya, Li Mu juga mentafsir kertas GPT, GPT-2 dan GPT-3 secara terperinci:

Ketahui dengan cepat perkara teknikal utama kertas InstructGPT: ikuti Li Mu untuk menguasai teknologi di sebalik ChatGPT

Alamat kursus: https://jmq.xet.tech/s/2lec6b

Atas ialah kandungan terperinci Ketahui dengan cepat perkara teknikal utama kertas InstructGPT: ikuti Li Mu untuk menguasai teknologi di sebalik ChatGPT. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Artikel ini dikembalikan pada:51CTO.COM. Jika ada pelanggaran, sila hubungi admin@php.cn Padam
Skop Gemma: Mikroskop Google ' s untuk mengintip ke proses pemikiran AI 'Skop Gemma: Mikroskop Google ' s untuk mengintip ke proses pemikiran AI 'Apr 17, 2025 am 11:55 AM

Meneroka kerja -kerja dalam model bahasa dengan skop Gemma Memahami kerumitan model bahasa AI adalah satu cabaran penting. Pelepasan Google Gemma Skop, Toolkit Komprehensif, menawarkan penyelidik cara yang kuat untuk menyelidiki

Siapa penganalisis perisikan perniagaan dan bagaimana menjadi satu?Siapa penganalisis perisikan perniagaan dan bagaimana menjadi satu?Apr 17, 2025 am 11:44 AM

Membuka Kejayaan Perniagaan: Panduan untuk Menjadi Penganalisis Perisikan Perniagaan Bayangkan mengubah data mentah ke dalam pandangan yang boleh dilakukan yang mendorong pertumbuhan organisasi. Ini adalah kuasa penganalisis Perniagaan Perniagaan (BI) - peranan penting dalam GU

Bagaimana untuk menambah lajur dalam SQL? - Analytics VidhyaBagaimana untuk menambah lajur dalam SQL? - Analytics VidhyaApr 17, 2025 am 11:43 AM

Pernyataan Jadual Alter SQL: Menambah lajur secara dinamik ke pangkalan data anda Dalam pengurusan data, kebolehsuaian SQL adalah penting. Perlu menyesuaikan struktur pangkalan data anda dengan cepat? Pernyataan Jadual ALTER adalah penyelesaian anda. Butiran panduan ini menambah colu

Penganalisis Perniagaan vs Penganalisis DataPenganalisis Perniagaan vs Penganalisis DataApr 17, 2025 am 11:38 AM

Pengenalan Bayangkan pejabat yang sibuk di mana dua profesional bekerjasama dalam projek kritikal. Penganalisis perniagaan memberi tumpuan kepada objektif syarikat, mengenal pasti bidang penambahbaikan, dan memastikan penjajaran strategik dengan trend pasaran. Simu

Apakah Count dan Counta dalam Excel? - Analytics VidhyaApakah Count dan Counta dalam Excel? - Analytics VidhyaApr 17, 2025 am 11:34 AM

Pengiraan dan Analisis Data Excel: Penjelasan terperinci mengenai fungsi Count dan Counta Pengiraan dan analisis data yang tepat adalah kritikal dalam Excel, terutamanya apabila bekerja dengan set data yang besar. Excel menyediakan pelbagai fungsi untuk mencapai matlamat ini, dengan fungsi Count dan CountA menjadi alat utama untuk mengira bilangan sel di bawah keadaan yang berbeza. Walaupun kedua -dua fungsi digunakan untuk mengira sel, sasaran reka bentuk mereka disasarkan pada jenis data yang berbeza. Mari menggali butiran khusus fungsi Count dan Counta, menyerlahkan ciri dan perbezaan unik mereka, dan belajar cara menerapkannya dalam analisis data. Gambaran keseluruhan perkara utama Memahami kiraan dan cou

Chrome ada di sini dengan AI: mengalami sesuatu yang baru setiap hari !!Chrome ada di sini dengan AI: mengalami sesuatu yang baru setiap hari !!Apr 17, 2025 am 11:29 AM

Revolusi AI Google Chrome: Pengalaman melayari yang diperibadikan dan cekap Kecerdasan Buatan (AI) dengan cepat mengubah kehidupan seharian kita, dan Google Chrome mengetuai pertuduhan di arena pelayaran web. Artikel ini meneroka exciti

Sisi Manusia Ai ' s: Kesejahteraan dan garis bawah empat kali gandaSisi Manusia Ai ' s: Kesejahteraan dan garis bawah empat kali gandaApr 17, 2025 am 11:28 AM

Impak Reimagining: garis bawah empat kali ganda Selama terlalu lama, perbualan telah dikuasai oleh pandangan sempit kesan AI, terutama memberi tumpuan kepada keuntungan bawah. Walau bagaimanapun, pendekatan yang lebih holistik mengiktiraf kesalinghubungan BU

5 Kes Pengkomputeran Kuantum Mengubah Permainan Yang Harus Anda Ketahui5 Kes Pengkomputeran Kuantum Mengubah Permainan Yang Harus Anda KetahuiApr 17, 2025 am 11:24 AM

Perkara bergerak terus ke arah itu. Pelaburan yang dicurahkan ke dalam penyedia perkhidmatan kuantum dan permulaan menunjukkan bahawa industri memahami kepentingannya. Dan semakin banyak kes penggunaan dunia nyata muncul untuk menunjukkan nilainya

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
1 bulan yang laluBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
1 bulan yang laluBy尊渡假赌尊渡假赌尊渡假赌
Akan R.E.P.O. Ada Crossplay?
1 bulan yang laluBy尊渡假赌尊渡假赌尊渡假赌

Alat panas

Versi Mac WebStorm

Versi Mac WebStorm

Alat pembangunan JavaScript yang berguna

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

Muat turun versi mac editor Atom

Muat turun versi mac editor Atom

Editor sumber terbuka yang paling popular

DVWA

DVWA

Damn Vulnerable Web App (DVWA) ialah aplikasi web PHP/MySQL yang sangat terdedah. Matlamat utamanya adalah untuk menjadi bantuan bagi profesional keselamatan untuk menguji kemahiran dan alatan mereka dalam persekitaran undang-undang, untuk membantu pembangun web lebih memahami proses mengamankan aplikasi web, dan untuk membantu guru/pelajar mengajar/belajar dalam persekitaran bilik darjah Aplikasi web keselamatan. Matlamat DVWA adalah untuk mempraktikkan beberapa kelemahan web yang paling biasa melalui antara muka yang mudah dan mudah, dengan pelbagai tahap kesukaran. Sila ambil perhatian bahawa perisian ini

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat ialah persekitaran pelayar selamat untuk mengambil peperiksaan dalam talian dengan selamat. Perisian ini menukar mana-mana komputer menjadi stesen kerja yang selamat. Ia mengawal akses kepada mana-mana utiliti dan menghalang pelajar daripada menggunakan sumber yang tidak dibenarkan.