Sendiri: Ai yang tahu bila hendak menyemak semula-AI-php.cn

Rumah

Peranti teknologi

Sendiri: Ai yang tahu bila hendak menyemak semula

Lisa Kudrow

Mar 08, 2025 am 09:24 AM

Generasi Pengambilan Pengambilan Diri (Rag sendiri): Meningkatkan LLMS dengan pengambilan semula dan kritikan diri

Model bahasa yang besar (LLMs) adalah transformatif, tetapi pergantungan mereka terhadap pengetahuan parametrik sering membawa kepada ketidaktepatan faktual. Generasi pengambilan semula (RAG) bertujuan untuk menangani perkara ini dengan menggabungkan pengetahuan luaran, tetapi kaedah RAG tradisional mengalami batasan. Artikel ini meneroka RAG diri, pendekatan baru yang meningkatkan kualiti dan faktual LLM.

Menangani kekurangan standard RAG

RAG standard mengambil nombor tetap petikan, tanpa mengira kaitannya. Ini membawa kepada beberapa isu:

Maklumat yang tidak relevan: Pengambilan dokumen yang tidak perlu mencairkan kualiti output.
Kekurangan penyesuaian: Ketidakupayaan untuk menyesuaikan pengambilan semula berdasarkan tuntutan tugas menghasilkan prestasi yang tidak konsisten.
output yang tidak konsisten: teks yang dihasilkan mungkin tidak sejajar dengan maklumat yang diambil kerana kekurangan latihan eksplisit mengenai integrasi pengetahuan.
ketiadaan penilaian diri: Tiada mekanisme untuk menilai kualiti atau kaitan petikan yang diambil atau output yang dihasilkan.
atribusi sumber terhad: petikan yang tidak mencukupi atau petunjuk sokongan sumber untuk teks yang dihasilkan.

Memperkenalkan Rag Diri: Pengambilan Adaptif dan Refleksi Sendiri

RAG sendiri meningkatkan LLM dengan mengintegrasikan pengambilan semula dan refleksi diri. Tidak seperti kain standard, ia secara dinamik mengambil bahagian -bahagian hanya apabila perlu, menggunakan "token mengambil." Secara asasnya, ia menggunakan token refleksi khas -Isrel (relevan), ISSUP (sokongan), dan ISUSE (utiliti) - untuk menilai proses penjanaannya sendiri.

Ciri-ciri utama RAG diri termasuk:

pengambilan semula permintaan: pengambilan yang cekap hanya apabila diperlukan.
Token Refleksi: Penilaian Sendiri Menggunakan Isrel, Issup, dan Token ISUSE.
diri sendiri: Penilaian kualiti dan kualiti output yang diambil.
Latihan akhir-ke-akhir: Latihan serentak penjanaan output dan ramalan token refleksi.
Penyahkodan yang disesuaikan: Pelarasan fleksibel frekuensi pengambilan dan penyesuaian kepada tugas yang berbeza.

aliran kerja RAG sendiri

Pemprosesan input dan keputusan pengambilan semula: Model menentukan jika pengetahuan luaran diperlukan.
Jika diperlukan, petikan yang relevan diambil menggunakan model retriever (mis., Contriever-MS Marco).
Model Generator memproses setiap laluan yang diambil, mewujudkan pelbagai calon kesinambungan dengan token kritikan yang berkaitan.
Token refleksi menilai relevansi (ISREL), sokongan (ISSUP), dan utiliti (ISUSE) bagi setiap segmen yang dihasilkan.
Carian rasuk peringkat segmen memilih urutan output terbaik berdasarkan skor berwajaran yang menggabungkan kebarangkalian token kritikan. Proses Latihan Proses latihan dua peringkat melibatkan latihan model pengkritik di luar talian untuk menjana token refleksi, diikuti dengan melatih model penjana menggunakan data yang ditambah dengan token ini.

Kelebihan Rag Diri

Self-RAG: AI That Knows When to Double-Check

Rag sendiri menawarkan beberapa kelebihan utama:

ketepatan faktual yang lebih baik:

pengambilan semula permintaan dan kritikan diri membawa kepada ketepatan faktual yang lebih tinggi.

Relevan yang dipertingkatkan: Pengambilan penyesuaian memastikan hanya maklumat yang relevan digunakan.
petikan dan verifiability yang lebih baik: petikan dan penilaian terperinci meningkatkan ketelusan dan kepercayaan.
tingkah laku yang disesuaikan: token refleksi membolehkan pelarasan khusus tugas.
Kesimpulan yang cekap: Latihan model pengkritik luar talian mengurangkan overhead kesimpulan.
pelaksanaan dengan Langchain dan Langgraph

Butiran artikel Pelaksanaan praktikal menggunakan Langchain dan Langgraph, meliputi persediaan ketergantungan, definisi model data, pemprosesan dokumen, konfigurasi penilai, persediaan rantai kain, fungsi aliran kerja, pembinaan aliran kerja, dan ujian. Kod ini menunjukkan cara membina sistem ragut diri yang mampu mengendalikan pelbagai pertanyaan dan menilai kaitan dan ketepatan responsnya.

Keterbatasan Rag Diri

Walaupun kelebihannya, RAG diri mempunyai batasan:

Output tidak disokong sepenuhnya: output mungkin tidak selalu disokong sepenuhnya oleh bukti yang dipetik.
Potensi untuk kesilapan faktual: Walaupun bertambah baik, ralat faktual masih boleh berlaku.
saiz model trade-off: model yang lebih kecil mungkin kadang-kadang mengatasi yang lebih besar dalam ketepatan faktual.
Penyesuaian perdagangan: Melaraskan berat token refleksi boleh memberi kesan kepada aspek lain dari output (mis., Lancar).

Kesimpulan

RAG diri mewakili kemajuan yang ketara dalam teknologi LLM. Dengan menggabungkan pengambilan semula adaptif dengan refleksi diri, ia menangani batasan utama RAG standard, menghasilkan output yang lebih tepat, relevan, dan dapat diverifikasi. Sifat yang disesuaikan dengan kerangka ini membolehkan menyesuaikan tingkah lakunya kepada pelbagai aplikasi, menjadikannya alat yang berkuasa untuk pelbagai tugas yang memerlukan ketepatan fakta yang tinggi. Pelaksanaan Langchain dan Langgraph yang disediakan menawarkan panduan praktikal untuk membina dan menggunakan sistem ragaman diri.

Soalan Lazim (Soalan Lazim) (bahagian Soalan Lazim dari teks asal dikekalkan di sini.)

Q1. Apakah rag sendiri?

Q2. Bagaimanakah ragaman diri berbeza dari kain standard?

Q3. Apakah token refleksi?

Q4. Apakah kelebihan utama RAG sendiri?

Q5. Bolehkah Rag sendiri sepenuhnya menghilangkan ketidaktepatan faktual?

(Nota: Imej kekal dalam format dan lokasi asalnya.)

Atas ialah kandungan terperinci Sendiri: Ai yang tahu bila hendak menyemak semula. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel Berkaitan

Ahli terapi AI ada di sini: 14 alat kesihatan mental yang perlu anda ketahuiApr 30, 2025 am 11:17 AM

Walaupun ia tidak dapat memberikan sambungan manusia dan intuisi ahli terapi terlatih, penyelidikan telah menunjukkan bahawa ramai orang selesa berkongsi kebimbangan dan kebimbangan mereka dengan bot AI yang agak tidak berwajah dan tanpa nama. Sama ada ini selalu baik saya

Memanggil AI ke lorong runcitApr 30, 2025 am 11:16 AM

Kecerdasan Buatan (AI), satu dekad teknologi dalam pembuatan, merevolusikan industri runcit makanan. Dari keuntungan kecekapan berskala besar dan pengurangan kos kepada proses yang diselaraskan di pelbagai fungsi perniagaan, kesan AI adalah undeniabl

Mendapatkan ceramah pep dari ai generatif untuk mengangkat semangat andaApr 30, 2025 am 11:15 AM

Mari kita bercakap mengenainya. Analisis terobosan AI yang inovatif ini adalah sebahagian daripada liputan lajur Forbes yang berterusan pada AI terkini termasuk mengenal pasti dan menjelaskan pelbagai kerumitan AI yang memberi kesan (lihat pautan di sini). Di samping itu, untuk comp saya

Mengapa Hyper-Personalization berkuasa AI adalah satu kemestian untuk semua perniagaanApr 30, 2025 am 11:14 AM

Mengekalkan imej profesional memerlukan kemas kini almari pakaian sekali -sekala. Walaupun membeli-belah dalam talian adalah mudah, ia tidak mempunyai kepastian percubaan secara peribadi. Penyelesaian saya? Peribadi yang berkuasa AI. Saya membayangkan pembantu AI yang mengendalikan pakaian selecti

Lupakan Duolingo: Ciri AI Baru Google Translate Mengajar BahasaApr 30, 2025 am 11:13 AM

Google Translate menambah fungsi pembelajaran bahasa Menurut Android Authority, App Expers AssembleDebug telah mendapati bahawa versi terbaru aplikasi Google Translate mengandungi mod ujian "amalan" baru yang direka untuk membantu pengguna meningkatkan kemahiran bahasa mereka melalui aktiviti yang diperibadikan. Ciri ini kini tidak dapat dilihat oleh pengguna, tetapi AssembleDebug dapat mengaktifkannya dan melihat beberapa elemen antara muka pengguna yang baru. Apabila diaktifkan, ciri ini menambah ikon topi tamat pengajian baru di bahagian bawah skrin yang ditandai dengan lencana "beta" yang menunjukkan bahawa ciri "amalan" akan dikeluarkan pada mulanya dalam bentuk eksperimen. Prompt pop timbul yang berkaitan menunjukkan "Amalan aktiviti yang disesuaikan untuk anda!", Yang bermaksud Google akan menjana disesuaikan

Mereka membuat TCP/IP untuk AI, dan ia dipanggil NandaApr 30, 2025 am 11:12 AM

Penyelidik MIT sedang membangunkan Nanda, protokol web yang direka untuk agen AI. Pendek untuk ejen rangkaian dan AI yang terdesentralisasi, Nanda membina Protokol Konteks Model Anthropic (MCP) dengan menambahkan keupayaan Internet, membolehkan AI AGEN

The Prompt: Deepfake Detection adalah perniagaan yang berkembang pesatApr 30, 2025 am 11:11 AM

Usaha terbaru Meta: Aplikasi AI untuk menyaingi chatgpt Meta, syarikat induk Facebook, Instagram, WhatsApp, dan Threads, melancarkan aplikasi berkuasa AI yang baru. Aplikasi mandiri ini, Meta AI, bertujuan untuk bersaing secara langsung dengan chatgpt Openai. Tuil

Dua tahun akan datang dalam keselamatan siber AI untuk pemimpin perniagaanApr 30, 2025 am 11:10 AM

Menavigasi serangan AI Cyber yang semakin meningkat Baru-baru ini, Jason Clinton, Ciso untuk Anthropic, menggariskan risiko yang muncul yang terikat kepada identiti bukan manusia-sebagai komunikasi komunikasi ke mesin, melindungi "identiti" ini menjadi

See all articles