Rumah  >  Artikel  >  Peranti teknologi  >  Google mengeluarkan ASPIRE, rangka kerja latihan model yang membolehkan AI menilai ketepatan output secara bebas

Google mengeluarkan ASPIRE, rangka kerja latihan model yang membolehkan AI menilai ketepatan output secara bebas

王林
王林ke hadapan
2024-01-23 17:36:101078semak imbas

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

Google baru-baru ini mengeluarkan kenyataan akhbar yang mengumumkan pelancaran rangka kerja latihan ASPIRE, yang direka khas untuk model bahasa besar. Rangka kerja ini bertujuan untuk meningkatkan keupayaan ramalan terpilih model AI.

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

Google menyebut bahawa model bahasa besar sedang berkembang pesat dalam pemahaman bahasa semula jadi dan penjanaan kandungan, dan telah digunakan untuk membina pelbagai aplikasi inovatif, tetapi masih tidak sesuai untuk menggunakannya pada situasi membuat keputusan berisiko tinggi. Ini disebabkan oleh ketidakpastian dan kemungkinan "halusinasi" dalam ramalan model Oleh itu, Google telah membangunkan rangka kerja latihan ASPIRE, yang memperkenalkan mekanisme "kredibiliti" kepada satu siri model , setiap Jawapan semuanya akan mempunyai skor kebarangkalian untuk betul .

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

▲ Sumber imej Siaran akhbar Google (sama di bawah)

Di peringkat teknikal, rangka kerja latihan boleh dibahagikan kepada tiga peringkat: pelarasan khusus tugasan, pensampelan jawapan dan pembelajaran penilaian kendiri.

Peringkat "pelarasan tugas khusus" adalah untuk menjalankan latihan mendalam model bahasa berskala besar yang telah menerima latihan asas,

memfokuskan kepada pengukuhan keupayaan ramalan model. Penyelidik terutamanya memperkenalkan satu siri parameter boleh laras kepada model dan memperhalusi model bahasa pra-latihan pada set data latihan tugasan tertentu, dengan itu meningkatkan prestasi ramalan model dan membolehkan model menyelesaikan masalah tertentu dengan lebih baik.

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

Peringkat kedua ialah "persampelan jawapan". Selepas penalaan halus tertentu, model boleh menggunakan parameter boleh laras yang dipelajari sebelum ini untuk menjana jawapan yang berbeza bagi setiap soalan latihan dan mencipta set data untuk pembelajaran penilaian kendiri satu siri jawapan dengan kredibiliti tinggi.

Para penyelidik menggunakan kedua-dua kaedah "Carian Pancaran" dan algoritma Rouge-L untuk menilai kualiti jawapan, dan memasukkan semula jawapan dan markah yang dijana ke dalam model untuk memulakan peringkat ketiga.

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

Dalam peringkat ketiga "pembelajaran penilaian kendiri", para penyelidik menambah set parameter boleh laras pada model khusus untuk meningkatkan keupayaan penilaian kendiri model.

Matlamat peringkat ini adalah untuk membiarkan model belajar "menghakimi ketepatan jawapan output dengan sendirinya", supaya apabila model bahasa besar menjana jawapan, ia juga akan melampirkan skor kebarangkalian jawapan yang betul.

Penyelidik Google menggunakan tiga set data soal jawab, CoQA, TriviaQA dan SQuAD, untuk mengesahkan keputusan rangka kerja latihan ASPIRE Dikatakan bahawa "model kecil OPT-2.7B yang diselaraskan oleh ASPIRE jauh mengatasi OPT- yang lebih besar. model 30B." Keputusan eksperimen juga menunjukkan bahawa dengan pelarasan yang sesuai, walaupun model bahasa yang kecil boleh mengatasi model bahasa yang besar dalam beberapa senario.

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

Para penyelidik membuat kesimpulan bahawa

latihan rangka kerja ASPIRE boleh meningkatkan ketepatan output model bahasa besar dengan ketara, malah model yang lebih kecil boleh membuat ramalan "tepat dan yakin" selepas penalaan halus.

Atas ialah kandungan terperinci Google mengeluarkan ASPIRE, rangka kerja latihan model yang membolehkan AI menilai ketepatan output secara bebas. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam