cari
RumahPeranti teknologiAIDeepSeek-R1 Rag Chatbot dengan Chroma, Ollama, dan Gradio

Tutorial ini menunjukkan membina chatbot Generasi Augmented Generasi (RAG) menggunakan DeepSeek-R1 dan Langchain. Chatbot menjawab soalan berdasarkan asas pengetahuan, dalam kes ini, sebuah buku mengenai asas -asas LLM. Proses ini memanfaatkan carian vektor efisien DeepSeek-R1 untuk respons yang tepat dan kontekstual yang relevan, disampaikan melalui antara muka gradio yang mesra pengguna.

Kekuatan DeepSeek-R1, termasuk pengambilan prestasi tinggi, kedudukan relevan halus, keberkesanan kos (disebabkan oleh pelaksanaan tempatan), integrasi mudah dengan Chroma, dan keupayaan luar talian, menjadikannya ideal untuk aplikasi ini.

Tutorial dibahagikan kepada langkah -langkah yang jelas:

1. Prasyarat: Memastikan perpustakaan yang diperlukan (Langchain, Chromadb, Gradio, Ollama, Pymupdf) dipasang.

2. Memuatkan PDF: Menggunakan pymupdfloader dari Langchain untuk mengekstrak teks dari "Asas LLMS" pdf.

3. Teks Chunking: Memisahkan teks yang diekstrak ke dalam ketulan yang lebih kecil dan bertindih menggunakan untuk pengambilan konteks yang lebih baik. RecursiveCharacterTextSplitter

4. Generasi Embedding: Menjana embeddings untuk setiap bahagian menggunakan Ollamaembeddings dengan DeepSeek-R1. Parallelization melalui mempercepatkan proses ini. Nota: Tutorial menyebutkan keupayaan untuk menentukan saiz model DeepSeek-R1 yang berbeza (7b, 8b, 14b, dan lain-lain). ThreadPoolExecutor

5. Menyimpan Embeddings dalam Chroma: Menyimpan embeddings dan ketulan teks yang sepadan dalam pangkalan data vektor Chroma untuk mendapatkan semula yang cekap. Tutorial menyoroti membuat dan/atau memadam koleksi untuk mengelakkan konflik.

6. Inisialisasi Retriever: Menyediakan Chroma Retriever, menggunakan embeddings DeepSeek-R1 untuk pemprosesan pertanyaan.

7. Paip RAG (pengambilan semula konteks): Fungsi mengambil potongan teks yang relevan berdasarkan soalan pengguna. retrieve_context

8. Meminta DeepSeek-R1: Format Format soalan pengguna dan konteks yang diambil, menghantarnya ke DeepSeek-R1 melalui Ollama, dan membersihkan respons untuk persembahan. query_deepseek

9. Antara Muka Vadio:

Mewujudkan antara muka interaktif menggunakan Vadio, membolehkan pengguna memasukkan soalan dan menerima jawapan dari saluran paip RAG.

DeepSeek-R1 RAG Chatbot With Chroma, Ollama, and Gradio Pengoptimuman:

Tutorial mencadangkan beberapa pengoptimuman, termasuk menyesuaikan saiz bahagian, menggunakan model DeepSeek-R1 yang lebih kecil, mengintegrasikan Faiss untuk dataset yang lebih besar, dan pemprosesan batch untuk generasi embedding.

Kesimpulan: Tutorial berjaya menunjukkan membina chatbot RAG tempatan yang berfungsi, mempamerkan kuasa DeepSeek-R1 untuk pengambilan maklumat yang cekap dan tepat. Pautan ke sumber DeepSeek lebih lanjut disediakan.

Atas ialah kandungan terperinci DeepSeek-R1 Rag Chatbot dengan Chroma, Ollama, dan Gradio. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Pembantu AI baru Meta: Booster Produktiviti atau Tenggelam Masa?Pembantu AI baru Meta: Booster Produktiviti atau Tenggelam Masa?May 01, 2025 am 11:18 AM

META telah bergabung dengan rakan-rakan seperti Nvidia, IBM dan Dell untuk mengembangkan integrasi penempatan peringkat perusahaan Llama Stack. Dari segi keselamatan, Meta telah melancarkan alat -alat baru seperti Llama Guard 4, Llamifirewall dan Cyberseceval 4, dan melancarkan program pembela Llama untuk meningkatkan keselamatan AI. Di samping itu, META telah mengedarkan $ 1.5 juta dalam geran Llama Impact kepada 10 institusi global, termasuk pemula yang bekerja untuk meningkatkan perkhidmatan awam, penjagaan kesihatan dan pendidikan. Permohonan Meta AI yang baru dikuasakan oleh Llama 4, dikandung sebagai Meta AI

80% Gen Zers akan berkahwin dengan AI: Kajian80% Gen Zers akan berkahwin dengan AI: KajianMay 01, 2025 am 11:17 AM

Joi Ai, sebuah syarikat yang merintis interaksi manusia-ai, telah memperkenalkan istilah "AI-Lationships" untuk menggambarkan hubungan yang berkembang ini. Jaime Bronstein, ahli terapi hubungan di Joi Ai, menjelaskan bahawa ini tidak dimaksudkan untuk menggantikan manusia c

AI membuat masalah bot Internet lebih teruk. Permulaan $ 2 bilion ini berada di barisan hadapanAI membuat masalah bot Internet lebih teruk. Permulaan $ 2 bilion ini berada di barisan hadapanMay 01, 2025 am 11:16 AM

Penipuan dalam talian dan serangan bot menimbulkan cabaran penting bagi perniagaan. Peruncit melawan bot produk penimbunan, pengambilalihan akaun Bank Battle, dan platform media sosial berjuang dengan peniru. Kebangkitan AI memburukkan lagi masalah ini, Rende

Menjual ke Robot: Revolusi Pemasaran yang akan membuat atau memecahkan perniagaan andaMenjual ke Robot: Revolusi Pemasaran yang akan membuat atau memecahkan perniagaan andaMay 01, 2025 am 11:15 AM

Ejen AI bersedia untuk merevolusikan pemasaran, yang berpotensi melampaui kesan peralihan teknologi terdahulu. Ejen -ejen ini, yang mewakili kemajuan yang signifikan dalam AI generatif, bukan sahaja memproses maklumat seperti chatgpt tetapi juga mengambil actio

Bagaimana Teknologi Penglihatan Komputer Mengubah NBA Playoff merasmikanBagaimana Teknologi Penglihatan Komputer Mengubah NBA Playoff merasmikanMay 01, 2025 am 11:14 AM

Impak AI terhadap keputusan NBA Game 4 penting Dua pertandingan NBA permainan yang penting mempamerkan peranan permainan AI yang berubah-ubah dalam merasmikan. Pada mulanya, Nikola Jokic dari Denver yang terlepas tiga pointer membawa kepada lorong-lorong terakhir yang terakhir oleh Aaron Gordon. Sony's Haw

Bagaimana AI mempercepat masa depan ubat regeneratifBagaimana AI mempercepat masa depan ubat regeneratifMay 01, 2025 am 11:13 AM

Secara tradisinya, memperluaskan kepakaran perubatan regeneratif secara global menuntut perjalanan yang luas, latihan tangan, dan tahun mentor. Sekarang, AI sedang mengubah landskap ini, mengatasi batasan geografi dan mempercepatkan kemajuan melalui en

Pengambilan kunci dari Intel Foundry Direct Connect 2025Pengambilan kunci dari Intel Foundry Direct Connect 2025May 01, 2025 am 11:12 AM

Intel sedang berusaha untuk mengembalikan proses pembuatannya ke kedudukan utama, sambil cuba menarik pelanggan semikonduktor yang hebat untuk membuat cip di fabanya. Untuk tujuan ini, Intel mesti membina lebih banyak kepercayaan dalam industri, bukan sahaja untuk membuktikan daya saing prosesnya, tetapi juga untuk menunjukkan bahawa rakan kongsi boleh mengeluarkan cip dalam aliran kerja yang biasa dan matang, konsisten dan sangat dipercayai. Semua yang saya dengar hari ini membuatkan saya percaya Intel bergerak ke arah matlamat ini. Ucapan utama CEO baru Tan Libai memulakan hari. Tan Libai adalah mudah dan ringkas. Beliau menggariskan beberapa cabaran dalam Perkhidmatan Foundry Intel dan langkah -langkah syarikat telah mengambil untuk menangani cabaran -cabaran ini dan merancang laluan yang berjaya untuk perkhidmatan Foundry Intel pada masa akan datang. Tan Libai bercakap mengenai proses perkhidmatan OEM Intel yang dilaksanakan untuk menjadikan pelanggan lebih banyak

Ai salah? Sekarang ada insurans ' s untuk ituAi salah? Sekarang ada insurans ' s untuk ituMay 01, 2025 am 11:11 AM

Mengulas kebimbangan yang semakin meningkat di sekitar risiko AI, Chaucer Group, firma insurans semula khusus global, dan Armilla AI telah bergabung untuk memperkenalkan produk insurans liabiliti pihak ketiga (TPL) novel. Dasar ini melindungi perniagaan terhadap

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

VSCode Windows 64-bit Muat Turun

VSCode Windows 64-bit Muat Turun

Editor IDE percuma dan berkuasa yang dilancarkan oleh Microsoft

SecLists

SecLists

SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.

DVWA

DVWA

Damn Vulnerable Web App (DVWA) ialah aplikasi web PHP/MySQL yang sangat terdedah. Matlamat utamanya adalah untuk menjadi bantuan bagi profesional keselamatan untuk menguji kemahiran dan alatan mereka dalam persekitaran undang-undang, untuk membantu pembangun web lebih memahami proses mengamankan aplikasi web, dan untuk membantu guru/pelajar mengajar/belajar dalam persekitaran bilik darjah Aplikasi web keselamatan. Matlamat DVWA adalah untuk mempraktikkan beberapa kelemahan web yang paling biasa melalui antara muka yang mudah dan mudah, dengan pelbagai tahap kesukaran. Sila ambil perhatian bahawa perisian ini

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat ialah persekitaran pelayar selamat untuk mengambil peperiksaan dalam talian dengan selamat. Perisian ini menukar mana-mana komputer menjadi stesen kerja yang selamat. Ia mengawal akses kepada mana-mana utiliti dan menghalang pelajar daripada menggunakan sumber yang tidak dibenarkan.