cari
RumahPeranti teknologiAIGoogle mengeluarkan ASPIRE, rangka kerja latihan model yang membolehkan AI menilai ketepatan output secara bebas

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

Google baru-baru ini mengeluarkan kenyataan akhbar yang mengumumkan pelancaran rangka kerja latihan ASPIRE, yang direka khas untuk model bahasa besar. Rangka kerja ini bertujuan untuk meningkatkan keupayaan ramalan terpilih model AI.

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

Google menyebut bahawa model bahasa besar sedang berkembang pesat dalam pemahaman bahasa semula jadi dan penjanaan kandungan, dan telah digunakan untuk membina pelbagai aplikasi inovatif, tetapi masih tidak sesuai untuk menggunakannya pada situasi membuat keputusan berisiko tinggi. Ini disebabkan oleh ketidakpastian dan kemungkinan "halusinasi" dalam ramalan model Oleh itu, Google telah membangunkan rangka kerja latihan ASPIRE, yang memperkenalkan mekanisme "kredibiliti" kepada satu siri model , setiap Jawapan semuanya akan mempunyai skor kebarangkalian untuk betul .

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

▲ Sumber imej Siaran akhbar Google (sama di bawah)

Di peringkat teknikal, rangka kerja latihan boleh dibahagikan kepada tiga peringkat: pelarasan khusus tugasan, pensampelan jawapan dan pembelajaran penilaian kendiri.

Peringkat "pelarasan tugas khusus" adalah untuk menjalankan latihan mendalam model bahasa berskala besar yang telah menerima latihan asas,

memfokuskan kepada pengukuhan keupayaan ramalan model. Penyelidik terutamanya memperkenalkan satu siri parameter boleh laras kepada model dan memperhalusi model bahasa pra-latihan pada set data latihan tugasan tertentu, dengan itu meningkatkan prestasi ramalan model dan membolehkan model menyelesaikan masalah tertentu dengan lebih baik.

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

Peringkat kedua ialah "persampelan jawapan". Selepas penalaan halus tertentu, model boleh menggunakan parameter boleh laras yang dipelajari sebelum ini untuk menjana jawapan yang berbeza bagi setiap soalan latihan dan mencipta set data untuk pembelajaran penilaian kendiri satu siri jawapan dengan kredibiliti tinggi.

Para penyelidik menggunakan kedua-dua kaedah "Carian Pancaran" dan algoritma Rouge-L untuk menilai kualiti jawapan, dan memasukkan semula jawapan dan markah yang dijana ke dalam model untuk memulakan peringkat ketiga.

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

Dalam peringkat ketiga "pembelajaran penilaian kendiri", para penyelidik menambah set parameter boleh laras pada model khusus untuk meningkatkan keupayaan penilaian kendiri model.

Matlamat peringkat ini adalah untuk membiarkan model belajar "menghakimi ketepatan jawapan output dengan sendirinya", supaya apabila model bahasa besar menjana jawapan, ia juga akan melampirkan skor kebarangkalian jawapan yang betul.

Penyelidik Google menggunakan tiga set data soal jawab, CoQA, TriviaQA dan SQuAD, untuk mengesahkan keputusan rangka kerja latihan ASPIRE Dikatakan bahawa "model kecil OPT-2.7B yang diselaraskan oleh ASPIRE jauh mengatasi OPT- yang lebih besar. model 30B." Keputusan eksperimen juga menunjukkan bahawa dengan pelarasan yang sesuai, walaupun model bahasa yang kecil boleh mengatasi model bahasa yang besar dalam beberapa senario.

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

Para penyelidik membuat kesimpulan bahawa

latihan rangka kerja ASPIRE boleh meningkatkan ketepatan output model bahasa besar dengan ketara, malah model yang lebih kecil boleh membuat ramalan "tepat dan yakin" selepas penalaan halus.

Atas ialah kandungan terperinci Google mengeluarkan ASPIRE, rangka kerja latihan model yang membolehkan AI menilai ketepatan output secara bebas. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Artikel ini dikembalikan pada:51CTO.COM. Jika ada pelanggaran, sila hubungi admin@php.cn Padam
Indeks Trend Kerja Microsoft 2025 menunjukkan ketegangan kapasiti tempat kerjaIndeks Trend Kerja Microsoft 2025 menunjukkan ketegangan kapasiti tempat kerjaApr 24, 2025 am 11:19 AM

Krisis kapasiti yang semakin meningkat di tempat kerja, yang diburukkan lagi oleh integrasi AI yang pesat, menuntut peralihan strategik melebihi pelarasan tambahan. Ini ditegaskan oleh penemuan WTI: 68% pekerja berjuang dengan beban kerja, yang membawa kepada bursa

Bolehkah AI faham? Hujah bilik Cina mengatakan tidak, tetapi adakah betul?Bolehkah AI faham? Hujah bilik Cina mengatakan tidak, tetapi adakah betul?Apr 24, 2025 am 11:18 AM

Hujah Bilik Cina John Searle: Cabaran untuk Memahami AI Percubaan pemikiran Searle secara langsung mempersoalkan sama ada kecerdasan buatan benar -benar dapat memahami bahasa atau mempunyai kesedaran yang benar. Bayangkan seseorang, jahil dari Chines

Pembantu AI yang 'pintar' China Echo Microsoft Recall Kekurangan PrivasiPembantu AI yang 'pintar' China Echo Microsoft Recall Kekurangan PrivasiApr 24, 2025 am 11:17 AM

Gergasi teknologi China mencatatkan kursus yang berbeza dalam pembangunan AI berbanding dengan rakan -rakan Barat mereka. Daripada memberi tumpuan semata-mata kepada penanda aras teknikal dan integrasi API, mereka mengutamakan "pembantu skrin" AI-AI T-

Docker membawa aliran kerja kontena yang biasa ke model AI dan alat MCPDocker membawa aliran kerja kontena yang biasa ke model AI dan alat MCPApr 24, 2025 am 11:16 AM

MCP: Memperkasakan Sistem AI untuk mengakses alat luaran Protokol Konteks Model (MCP) membolehkan aplikasi AI berinteraksi dengan alat luaran dan sumber data melalui antara muka yang diseragamkan. Dibangunkan oleh antropik dan disokong oleh penyedia AI utama, MCP membolehkan model bahasa dan ejen untuk menemui alat yang ada dan memanggilnya dengan parameter yang sesuai. Walau bagaimanapun, terdapat beberapa cabaran dalam melaksanakan pelayan MCP, termasuk konflik alam sekitar, kelemahan keselamatan, dan tingkah laku silang platform yang tidak konsisten. Artikel Forbes "Protokol Konteks Model Anthropic adalah langkah besar dalam pembangunan ejen AI" Pengarang: Janakiram MsvDocker menyelesaikan masalah ini melalui kontena. Doc dibina di Infrastruktur Hab Docker

Menggunakan strategi pintar 6 AI Street untuk membina permulaan bilion dolarMenggunakan strategi pintar 6 AI Street untuk membina permulaan bilion dolarApr 24, 2025 am 11:15 AM

Enam strategi yang digunakan oleh usahawan berwawasan yang memanfaatkan teknologi canggih dan kecerdasan perniagaan yang cerdik untuk mewujudkan syarikat yang sangat menguntungkan dan berskala sambil mengekalkan kawalan. Panduan ini adalah untuk usahawan yang bercita -cita untuk membina a

Kemas kini foto Google membuka kunci Ultra HDR yang menakjubkan untuk semua gambar andaKemas kini foto Google membuka kunci Ultra HDR yang menakjubkan untuk semua gambar andaApr 24, 2025 am 11:14 AM

Alat Ultra HDR baru Google Photos: Pengubah Permainan untuk Peningkatan Imej Foto Google telah memperkenalkan alat penukaran Ultra HDR yang kuat, mengubah gambar standard menjadi imej jarak jauh yang tinggi. Peningkatan ini memberi manfaat kepada jurugambar a

Descope Membina Rangka Kerja Pengesahan untuk Integrasi Agen AIDescope Membina Rangka Kerja Pengesahan untuk Integrasi Agen AIApr 24, 2025 am 11:13 AM

Senibina teknikal menyelesaikan cabaran pengesahan yang muncul Hub Identiti Agentik menangani masalah banyak organisasi yang hanya ditemui selepas permulaan pelaksanaan ejen AI bahawa kaedah pengesahan tradisional tidak direka untuk mesin-

Google Cloud Seterusnya 2025 dan masa depan kerja moden yang bersambungGoogle Cloud Seterusnya 2025 dan masa depan kerja moden yang bersambungApr 24, 2025 am 11:12 AM

(Nota: Google adalah pelanggan penasihat firma saya, Moor Insights & Strategy.) AI: Dari Eksperimen ke Yayasan Enterprise Google Cloud Next 2025 mempamerkan evolusi AI dari ciri eksperimen ke komponen teras teknologi perusahaan, aliran

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

VSCode Windows 64-bit Muat Turun

VSCode Windows 64-bit Muat Turun

Editor IDE percuma dan berkuasa yang dilancarkan oleh Microsoft

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

Persekitaran pembangunan bersepadu PHP yang berkuasa

MantisBT

MantisBT

Mantis ialah alat pengesan kecacatan berasaskan web yang mudah digunakan yang direka untuk membantu dalam pengesanan kecacatan produk. Ia memerlukan PHP, MySQL dan pelayan web. Lihat perkhidmatan demo dan pengehosan kami.

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

mPDF

mPDF

mPDF ialah perpustakaan PHP yang boleh menjana fail PDF daripada HTML yang dikodkan UTF-8. Pengarang asal, Ian Back, menulis mPDF untuk mengeluarkan fail PDF "dengan cepat" dari tapak webnya dan mengendalikan bahasa yang berbeza. Ia lebih perlahan dan menghasilkan fail yang lebih besar apabila menggunakan fon Unicode daripada skrip asal seperti HTML2FPDF, tetapi menyokong gaya CSS dsb. dan mempunyai banyak peningkatan. Menyokong hampir semua bahasa, termasuk RTL (Arab dan Ibrani) dan CJK (Cina, Jepun dan Korea). Menyokong elemen peringkat blok bersarang (seperti P, DIV),