IVG: Mengintegrasikan Nilai Manusia ke dalam Model Bahasa Besar pada Masa Inferens
Penyelidik membangunkan kaedah penjajaran masa Inferens untuk menyepadukan nilai manusia selepas menyempurnakan LLM menggunakan fungsi tersirat dan eksplisit tanpa mengubah model asas.
Menyepadukan nilai kemanusiaan selepas melatih model dengan algoritma berasaskan Pembelajaran memerlukan LLM yang diperhalusi, yang mahal dari segi pengiraan dan memakan masa. Selain itu, ia menghasilkan tindak balas yang berat sebelah dan tidak diingini oleh pengguna. Model yang cekap boleh menyesuaikan diri dengan pilihan pengguna dalam masa nyata dengan menyepadukan algoritma yang boleh mengganggu pada masa inferens diperlukan. Kaedah ini akan mengelak daripada melatih semula model berulang kali untuk hasil yang diingini dengan membekukan model asas dan mengurangkan kos pengiraan penalaan halus LLM.
Penyelidik membangunkan kaedah penjajaran masa Inferens untuk menyepadukan nilai manusia selepas menyempurnakan LLM menggunakan fungsi tersirat dan eksplisit tanpa mengubah model asas. Fungsi tersirat digunakan untuk penjanaan token, yang menjalankan penilaian perkataan demi perkataan dan memilih output dengan kebarangkalian tertinggi. Sebaliknya, fungsi eksplisit memerlukan struktur tegar untuk menilai ketulan teks yang lebih besar dan menjana urutan perkataan berikut dengan kebarangkalian tertinggi sambil mengekalkan konteks keseluruhan. Fungsi eksplisit tidak fleksibel dan mahal dari segi pengiraan, gagal menangani pengoptimuman peringkat token, manakala fungsi tersirat menghadapi isu kebolehtafsiran dan memerlukan hantaran hadapan yang kerap, yang membawa kepada kecekapan masa nyata yang rendah.
Untuk menangani kelemahan kedua-dua fungsi, kaedah yang dicadangkan, Bimbingan Nilai Bersepadu (IVG), menggabungkan pengoptimuman tahap token fungsi tersirat dan perspektif yang lebih luas fungsi eksplisit. Ia dapat menangkis cabaran penyesuaian dan pertukaran dalam keberkesanan penjajaran, yang membawa kepada penurunan percanggahan prestasi dan menjadikannya lebih mudah untuk dilaksanakan. Kelebihan ini memudahkan prestasi yang lebih baik pada tugas seperti penjanaan sentimen terkawal dan ringkasan. IVG, digabungkan dengan model yang lebih kecil seperti GPT-2, boleh bersaing dengan model yang lebih tinggi.
IVG menggabungkan dua fungsi nilai, fungsi tersirat dan eksplisit, untuk menyelaraskan model dengan nilai manusia. Pertama, pensampelan mengikut token memperhalusi token individu kepada panjang jujukan tertentu, menjana berbilang jujukan. Kemudian, carian rasuk peringkat ketulan membandingkan kebarangkalian jujukan ini dan memilih satu yang mempunyai kebarangkalian tertinggi. Walaupun kaedah ini memastikan bahawa output lebih mantap, kuasa pengiraan meningkat semasa masa inferens disebabkan oleh hantaran ke hadapan yang kerap, yang membawa kepada tindak balas yang lebih perlahan.
Penyelidik telah menggunakan dua set-up percubaan untuk menilai IVG: 1. Penjanaan sentimen terkawal dan Rumusan, dan 2. Mengikuti arahan. Dalam yang pertama, keluarga model GPT-2 digunakan dengan memanfaatkan set data sintetik daripada model ganjaran emas untuk menjana ulasan filem yang positif dan meringkaskan siaran Reddit. Sebagai perbandingan, yang kedua memerlukan model yang ditala arahan, AlpacaEval 2.0. Ia menggunakan Tulu Guidance, yang menggunakan model khusus untuk fungsi tersirat dan melatih model berasaskan ganjaran untuk fungsi eksplisit, dan Ultraguidance, yang memperhalusi model dengan Pengoptimuman Keutamaan Terus (DPO) untuk kedua-dua fungsi. GPT-4-turbo telah digunakan sebagai rujukan untuk menilai respons dalam percubaan kedua, dan IVG secara konsisten menunjukkan prestasi yang baik.
Selain dua eksperimen ini, kajian ablasi membuktikan bahawa Carian Rasuk Tahap Chunk (CBS) mempunyai kecekapan kelajuan yang lebih tinggi daripada Penalaan Halus Emulator (EFT), yang menggunakan fungsi tersirat untuk penalaan halus. Keputusan ini telah membuktikan bahawa CBS adalah lebih baik untuk digunakan dalam amalan.
Kesimpulannya, Bimbingan Nilai Bersepadu (IVG) menawarkan pendekatan baru dan cekap untuk menyelaraskan model bahasa besar dengan keutamaan manusia semata-mata pada masa inferens, memintas kerumitan penalaan halus tradisional. Dengan memanfaatkan fungsi nilai tersirat dan eksplisit, IVG meningkatkan prestasi dalam kedua-dua pensampelan mengikut token dan penyahkodan tahap ketulan, seperti yang ditunjukkan melalui peningkatan ketara dalam penjanaan sentimen, ringkasan dan tugasan mengikut arahan. Keputusan menunjukkan bahawa IVG ialah kaedah serba boleh, memberikan bukti empirikal yang kukuh tentang keupayaannya untuk mengatasi pendekatan sedia ada, menjadikannya penyelesaian yang menjanjikan untuk memperhalusi model besar dalam aplikasi dunia sebenar.
Jangan Lupa sertai 50k ML SubReddit kami
Ingin tampil di hadapan 1 Juta Pembaca AI? Bekerjasama dengan kami di sini
Atas ialah kandungan terperinci IVG: Mengintegrasikan Nilai Manusia ke dalam Model Bahasa Besar pada Masa Inferens. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

10 laman web perisian pasaran percuma yang disyorkan: 1. Binance, 2. OKX, 3.

Untuk mengakses platform rasmi Binance dan memuat turun aplikasinya, anda boleh menggunakan langkah -langkah berikut: 1) Gunakan enjin carian yang dipercayai untuk mencari "Binance" dan periksa nama domain; 2) Lihat media sosial rasmi untuk mendapatkan URL; 3) berunding dengan perkhidmatan pelanggan rasmi untuk mengesahkan URL; 4) Gunakan laman web navigasi yang dipercayai. Langkah -langkah untuk memuat turun aplikasinya termasuk: 1) Lawati laman web rasmi Binance; 2) Cari portal muat turun aplikasi; 3) Pilih kaedah muat turun (imbas kod QR, muat turun App Store, dan muat turun secara langsung fail APK).

Melalui langkah -langkah berikut, anda boleh mengakses platform rasmi OUYI dengan selamat dan memuat turun aplikasi: 1. Gunakan enjin carian yang dipercayai untuk mencari "Ouyi" atau "OKX" untuk memeriksa nama domain; 2. Semak akaun media sosial rasmi untuk mendapatkan URL; 3. Rujuk perkhidmatan pelanggan rasmi untuk mengesahkan URL; 4. Gunakan laman web navigasi yang dipercayai. Apabila memuat turun aplikasinya, lawati laman web rasmi, cari portal muat turun, pilih cara mengimbas kod QR, App Store, atau secara langsung memuat turun fail APK, dan perhatikan untuk memeriksa maklumat pemaju, melihat ulasan pengguna, memasang perisian keselamatan, berhati -hati dengan laman web phishing dan aplikasi dari sumber yang tidak diketahui, dan melindungi maklumat peribadi.

Untuk memuat turun aplikasi Binance dengan selamat, anda perlu melalui saluran rasmi: 1. Lawati laman web rasmi Binance, 2. Cari dan klik portal muat turun aplikasi, 3.

Kaedah untuk memuat turun aplikasi Okx dengan selamat termasuk: 1. Gunakan enjin carian yang dipercayai untuk mencari dan periksa nama domain; 2. Semak akaun media sosial rasmi dan kenal pasti logo pensijilan; 3. Rujuk perkhidmatan pelanggan rasmi untuk mengesahkan kesahihan pautan; 4. Gunakan laman web navigasi yang dipercayai untuk mendapatkan pautan muat turun yang disahkan. Melalui langkah -langkah ini, anda boleh memuat turun aplikasi OUYI dengan selamat dan memulakan perjalanan perdagangan cryptocurrency anda.

Langkah -langkah untuk mendaftarkan akaun OUYI adalah seperti berikut: 1. Sediakan e -mel atau nombor telefon bimbit yang sah dan menstabilkan rangkaian. 2. Lawati laman web rasmi Ouyi. 3. Masukkan halaman pendaftaran. 4. Pilih e -mel atau nombor telefon bimbit untuk mendaftar dan isi maklumat. 5. Dapatkan dan isi kod pengesahan. 6. Setuju dengan Perjanjian Pengguna. 7. Pendaftaran lengkap dan log masuk, menjalankan KYC dan menubuhkan langkah keselamatan.

Langkah -langkah untuk mendaftarkan akaun Binance termasuk: 1. Sediakan e -mel atau nombor telefon bimbit yang sah dan rangkaian yang stabil; 2. Lawati laman web rasmi Binance; 3. Masukkan halaman pendaftaran; 4. Pilih kaedah pendaftaran; 5. Isi maklumat pendaftaran; 6. Setuju dengan Perjanjian Pengguna; 7. Pengesahan Lengkap; 8. Dapatkan dan isi kod pengesahan; 9. Pendaftaran Lengkap.

Mendaftarkan akaun Open Door Wijen memerlukan 7 langkah: 1. Sediakan e -mel atau nombor telefon bimbit yang sah dan rangkaian yang stabil; 2. Lawati laman web rasmi; 3. Masukkan halaman pendaftaran; 4. Pilih dan isikan kaedah pendaftaran; 5. Dapatkan dan isi kod pengesahan; 6. Setuju dengan Perjanjian Pengguna; 7. Pendaftaran lengkap dan log masuk, disyorkan untuk menjalankan KYC dan menetapkan langkah keselamatan.

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

PhpStorm versi Mac
Alat pembangunan bersepadu PHP profesional terkini (2018.2.1).

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 Linux versi baharu
SublimeText3 Linux versi terkini

mPDF
mPDF ialah perpustakaan PHP yang boleh menjana fail PDF daripada HTML yang dikodkan UTF-8. Pengarang asal, Ian Back, menulis mPDF untuk mengeluarkan fail PDF "dengan cepat" dari tapak webnya dan mengendalikan bahasa yang berbeza. Ia lebih perlahan dan menghasilkan fail yang lebih besar apabila menggunakan fon Unicode daripada skrip asal seperti HTML2FPDF, tetapi menyokong gaya CSS dsb. dan mempunyai banyak peningkatan. Menyokong hampir semua bahasa, termasuk RTL (Arab dan Ibrani) dan CJK (Cina, Jepun dan Korea). Menyokong elemen peringkat blok bersarang (seperti P, DIV),

Penyesuai Pelayan SAP NetWeaver untuk Eclipse
Integrasikan Eclipse dengan pelayan aplikasi SAP NetWeaver.
