Generasi Pengambilan Pengambilan Diri (Rag sendiri): Meningkatkan LLMS dengan pengambilan semula dan kritikan diri
Model bahasa yang besar (LLMs) adalah transformatif, tetapi pergantungan mereka terhadap pengetahuan parametrik sering membawa kepada ketidaktepatan faktual. Generasi pengambilan semula (RAG) bertujuan untuk menangani perkara ini dengan menggabungkan pengetahuan luaran, tetapi kaedah RAG tradisional mengalami batasan. Artikel ini meneroka RAG diri, pendekatan baru yang meningkatkan kualiti dan faktual LLM.
Menangani kekurangan standard RAG
RAG standard mengambil nombor tetap petikan, tanpa mengira kaitannya. Ini membawa kepada beberapa isu:
- Maklumat yang tidak relevan: Pengambilan dokumen yang tidak perlu mencairkan kualiti output.
- Kekurangan penyesuaian: Ketidakupayaan untuk menyesuaikan pengambilan semula berdasarkan tuntutan tugas menghasilkan prestasi yang tidak konsisten.
- output yang tidak konsisten: teks yang dihasilkan mungkin tidak sejajar dengan maklumat yang diambil kerana kekurangan latihan eksplisit mengenai integrasi pengetahuan.
- ketiadaan penilaian diri: Tiada mekanisme untuk menilai kualiti atau kaitan petikan yang diambil atau output yang dihasilkan.
- atribusi sumber terhad: petikan yang tidak mencukupi atau petunjuk sokongan sumber untuk teks yang dihasilkan.
Memperkenalkan Rag Diri: Pengambilan Adaptif dan Refleksi Sendiri
RAG sendiri meningkatkan LLM dengan mengintegrasikan pengambilan semula dan refleksi diri. Tidak seperti kain standard, ia secara dinamik mengambil bahagian -bahagian hanya apabila perlu, menggunakan "token mengambil." Secara asasnya, ia menggunakan token refleksi khas -Isrel (relevan), ISSUP (sokongan), dan ISUSE (utiliti) - untuk menilai proses penjanaannya sendiri.
Ciri-ciri utama RAG diri termasuk:
- pengambilan semula permintaan: pengambilan yang cekap hanya apabila diperlukan.
- Token Refleksi: Penilaian Sendiri Menggunakan Isrel, Issup, dan Token ISUSE.
- diri sendiri: Penilaian kualiti dan kualiti output yang diambil.
- Latihan akhir-ke-akhir: Latihan serentak penjanaan output dan ramalan token refleksi.
- Penyahkodan yang disesuaikan: Pelarasan fleksibel frekuensi pengambilan dan penyesuaian kepada tugas yang berbeza.
aliran kerja RAG sendiri
- Pemprosesan input dan keputusan pengambilan semula: Model menentukan jika pengetahuan luaran diperlukan. Pengambilan petikan yang relevan:
- Jika diperlukan, petikan yang relevan diambil menggunakan model retriever (mis., Contriever-MS Marco). Pemprosesan Paralel dan Generasi Segmen:
- Model Generator memproses setiap laluan yang diambil, mewujudkan pelbagai calon kesinambungan dengan token kritikan yang berkaitan. Kritikan diri dan penilaian:
- Token refleksi menilai relevansi (ISREL), sokongan (ISSUP), dan utiliti (ISUSE) bagi setiap segmen yang dihasilkan. Pemilihan segmen dan output terbaik:
- Carian rasuk peringkat segmen memilih urutan output terbaik berdasarkan skor berwajaran yang menggabungkan kebarangkalian token kritikan. Proses Latihan Proses latihan dua peringkat melibatkan latihan model pengkritik di luar talian untuk menjana token refleksi, diikuti dengan melatih model penjana menggunakan data yang ditambah dengan token ini.
-
ketepatan faktual yang lebih baik:
pengambilan semula permintaan dan kritikan diri membawa kepada ketepatan faktual yang lebih tinggi.
- Relevan yang dipertingkatkan: Pengambilan penyesuaian memastikan hanya maklumat yang relevan digunakan.
- petikan dan verifiability yang lebih baik: petikan dan penilaian terperinci meningkatkan ketelusan dan kepercayaan.
- tingkah laku yang disesuaikan: token refleksi membolehkan pelarasan khusus tugas.
- Kesimpulan yang cekap: Latihan model pengkritik luar talian mengurangkan overhead kesimpulan.
- pelaksanaan dengan Langchain dan Langgraph
Keterbatasan Rag Diri
Walaupun kelebihannya, RAG diri mempunyai batasan:
- Output tidak disokong sepenuhnya: output mungkin tidak selalu disokong sepenuhnya oleh bukti yang dipetik.
- Potensi untuk kesilapan faktual: Walaupun bertambah baik, ralat faktual masih boleh berlaku.
- saiz model trade-off: model yang lebih kecil mungkin kadang-kadang mengatasi yang lebih besar dalam ketepatan faktual.
- Penyesuaian perdagangan: Melaraskan berat token refleksi boleh memberi kesan kepada aspek lain dari output (mis., Lancar).
Kesimpulan
RAG diri mewakili kemajuan yang ketara dalam teknologi LLM. Dengan menggabungkan pengambilan semula adaptif dengan refleksi diri, ia menangani batasan utama RAG standard, menghasilkan output yang lebih tepat, relevan, dan dapat diverifikasi. Sifat yang disesuaikan dengan kerangka ini membolehkan menyesuaikan tingkah lakunya kepada pelbagai aplikasi, menjadikannya alat yang berkuasa untuk pelbagai tugas yang memerlukan ketepatan fakta yang tinggi. Pelaksanaan Langchain dan Langgraph yang disediakan menawarkan panduan praktikal untuk membina dan menggunakan sistem ragaman diri.
Soalan Lazim (Soalan Lazim) (bahagian Soalan Lazim dari teks asal dikekalkan di sini.)
Q1. Apakah rag sendiri?
Q2. Bagaimanakah ragaman diri berbeza dari kain standard?Q3. Apakah token refleksi?
Q4. Apakah kelebihan utama RAG sendiri?Q5. Bolehkah Rag sendiri sepenuhnya menghilangkan ketidaktepatan faktual?
(Nota: Imej kekal dalam format dan lokasi asalnya.)Atas ialah kandungan terperinci Sendiri: Ai yang tahu bila hendak menyemak semula. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Walaupun ia tidak dapat memberikan sambungan manusia dan intuisi ahli terapi terlatih, penyelidikan telah menunjukkan bahawa ramai orang selesa berkongsi kebimbangan dan kebimbangan mereka dengan bot AI yang agak tidak berwajah dan tanpa nama. Sama ada ini selalu baik saya

Kecerdasan Buatan (AI), satu dekad teknologi dalam pembuatan, merevolusikan industri runcit makanan. Dari keuntungan kecekapan berskala besar dan pengurangan kos kepada proses yang diselaraskan di pelbagai fungsi perniagaan, kesan AI adalah undeniabl

Mari kita bercakap mengenainya. Analisis terobosan AI yang inovatif ini adalah sebahagian daripada liputan lajur Forbes yang berterusan pada AI terkini termasuk mengenal pasti dan menjelaskan pelbagai kerumitan AI yang memberi kesan (lihat pautan di sini). Di samping itu, untuk comp saya

Mengekalkan imej profesional memerlukan kemas kini almari pakaian sekali -sekala. Walaupun membeli-belah dalam talian adalah mudah, ia tidak mempunyai kepastian percubaan secara peribadi. Penyelesaian saya? Peribadi yang berkuasa AI. Saya membayangkan pembantu AI yang mengendalikan pakaian selecti

Google Translate menambah fungsi pembelajaran bahasa Menurut Android Authority, App Expers AssembleDebug telah mendapati bahawa versi terbaru aplikasi Google Translate mengandungi mod ujian "amalan" baru yang direka untuk membantu pengguna meningkatkan kemahiran bahasa mereka melalui aktiviti yang diperibadikan. Ciri ini kini tidak dapat dilihat oleh pengguna, tetapi AssembleDebug dapat mengaktifkannya dan melihat beberapa elemen antara muka pengguna yang baru. Apabila diaktifkan, ciri ini menambah ikon topi tamat pengajian baru di bahagian bawah skrin yang ditandai dengan lencana "beta" yang menunjukkan bahawa ciri "amalan" akan dikeluarkan pada mulanya dalam bentuk eksperimen. Prompt pop timbul yang berkaitan menunjukkan "Amalan aktiviti yang disesuaikan untuk anda!", Yang bermaksud Google akan menjana disesuaikan

Penyelidik MIT sedang membangunkan Nanda, protokol web yang direka untuk agen AI. Pendek untuk ejen rangkaian dan AI yang terdesentralisasi, Nanda membina Protokol Konteks Model Anthropic (MCP) dengan menambahkan keupayaan Internet, membolehkan AI AGEN

Usaha terbaru Meta: Aplikasi AI untuk menyaingi chatgpt Meta, syarikat induk Facebook, Instagram, WhatsApp, dan Threads, melancarkan aplikasi berkuasa AI yang baru. Aplikasi mandiri ini, Meta AI, bertujuan untuk bersaing secara langsung dengan chatgpt Openai. Tuil

Menavigasi serangan AI Cyber yang semakin meningkat Baru-baru ini, Jason Clinton, Ciso untuk Anthropic, menggariskan risiko yang muncul yang terikat kepada identiti bukan manusia-sebagai komunikasi komunikasi ke mesin, melindungi "identiti" ini menjadi


Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

MantisBT
Mantis ialah alat pengesan kecacatan berasaskan web yang mudah digunakan yang direka untuk membantu dalam pengesanan kecacatan produk. Ia memerlukan PHP, MySQL dan pelayan web. Lihat perkhidmatan demo dan pengehosan kami.

EditPlus versi Cina retak
Saiz kecil, penyerlahan sintaks, tidak menyokong fungsi gesaan kod

SublimeText3 versi Inggeris
Disyorkan: Versi Win, menyokong gesaan kod!

SublimeText3 Linux versi baharu
SublimeText3 Linux versi terkini

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma
