Deepseek-R1 Rag Chatbot mit Chroma, Ollama und Gradio-KI-php.cn

Heim

Technologie-Peripheriegeräte

Deepseek-R1 Rag Chatbot mit Chroma, Ollama und Gradio

Joseph Gordon-Levitt

Feb 28, 2025 pm 04:36 PM

Dieses Tutorial zeigt, dass ein Chatbot (Abruf Augmented Generation) mit Deepseek-R1 und Langchain aufgebaut wird. Der Chatbot beantwortet Fragen auf der Grundlage einer Wissensbasis, in diesem Fall ein Buch über die Grundlagen von LLMs. Der Prozess nutzt die effiziente Vektorsuche von Deepseek-R1 nach genauen und kontextbezogenen Antworten, die über eine benutzerfreundliche Gradio-Schnittstelle geliefert werden.

Die Stärken von Deepseek-R1, einschließlich Hochleistungs-Abruf, feinkörniger Relevanzranking, Kosteneffizienz (aufgrund der lokalen Ausführung), einfacher Integration in Chroma und Offline-Funktionen, machen Sie es ideal für diese Anwendung.

Das Tutorial ist in klare Schritte unterteilt:

1. Voraussetzungen: Sicherstellen, dass die erforderlichen Bibliotheken (Langchain, Chromadb, Gradio, Ollama, Pymupdf) installiert sind.

2. Laden des PDF: Verwenden Sie Pymupdfloader aus Langchain, um Text aus den "Foundations of LLMs" PDF zu extrahieren.

3. Text -Chunking: Aufteilen des extrahierten Textes in kleinere, überlappende Stücke mit RecursiveCharacterTextSplitter für eine verbesserte Kontextabnahme.

4. Einbettung der Erzeugung: Erzeugen von Einbettungen für jeden Chunk mit Ollamaembeding mit Deepseek-R1. Die Parallelisierung über ThreadPoolExecutor beschleunigt diesen Prozess. Hinweis: In der Tutorial wird die Möglichkeit erwähnt, verschiedene Deepseek-R1-Modellgrößen (7b, 8b, 14b usw.) anzugeben.

5. Speichern von Einbettungen in Chroma: Speichern der Einbettungen und entsprechenden Textbrocken in einer Chroma -Vektor -Datenbank zum effizienten Abrufen. Das Tutorial zeigt, dass die Sammlung erstellt und/oder löscht, um Konflikte zu verhindern.

6. Retriever-Initialisierung: Einrichten des Chroma Retriever unter Verwendung von Deepseek-R1-Einbettungen für die Abfrageverarbeitung.

7. RAG -Pipeline (Kontextabnahme): Eine Funktion retrieve_context ruft relevante Textbrocken basierend auf der Frage eines Benutzers ab.

8. Abfragen von Deepseek-R1: Die Funktion query_deepseek formatiert die Frage des Benutzers und den abgerufenen Kontext, sendet sie über Ollama an Deepseek-R1 und reinigt die Antwort für die Präsentation.

9. Gradio -Schnittstelle: Erstellen einer interaktiven Schnittstelle mit Gradio, sodass Benutzer Fragen eingeben und Antworten aus der RAG -Pipeline erhalten.

DeepSeek-R1 RAG Chatbot With Chroma, Ollama, and Gradio

Optimierungen: Das Tutorial schlägt mehrere Optimierungen vor, einschließlich der Anpassung der Chunk-Größe, der Verwendung kleinerer Deepseek-R1-Modelle, der Integration von FAISS für größere Datensätze und der Batch-Verarbeitung für die Einbettungserzeugung.

DeepSeek-R1 RAG Chatbot With Chroma, Ollama, and Gradio

Schlussfolgerung: Das Tutorial zeigt erfolgreich, einen funktionalen lokalen Lag-Chatbot zu erstellen, der die Kraft von Deepseek-R1 für ein effizientes und genaues Informationsabruf zeigt. Links zu weiteren Deepseek -Ressourcen werden bereitgestellt.

Das obige ist der detaillierte Inhalt vonDeepseek-R1 Rag Chatbot mit Chroma, Ollama und Gradio. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Verwandter Artikel

Der neue KI -Assistent von Meta: Produktivitätswahrnehmung oder Zeitspüle?May 01, 2025 am 11:18 AM

Meta hat sich mit Partnern wie Nvidia, IBM und Dell zusammengetan, um die Einsatzintegration von Lama Stack auf Unternehmensebene zu erweitern. In Bezug auf die Sicherheit hat Meta neue Tools wie Llam Guard 4, Llamafirewall und Cyberseceval 4 auf den Markt gebracht und das Lama Defenders -Programm gestartet, um die KI -Sicherheit zu verbessern. Darüber hinaus hat Meta 1,5 Millionen US -Dollar an Lama -Impact -Zuschüssen an 10 globale Institutionen verteilt, darunter Startups, die an der Verbesserung der öffentlichen Dienste, der Gesundheitsversorgung und der Bildung arbeiten. Die neue Meta -AI -Anwendung von Lama 4, die als Meta AI konzipiert wurde

80% der Gen -Zers würden eine KI heiraten: StudiumMay 01, 2025 am 11:17 AM

Joi Ai, eine Firma Pionierin der Human-AI-Interaktion, hat den Begriff "AI-Lationships" eingeführt, um diese sich entwickelnden Beziehungen zu beschreiben. Jaime Bronstein, ein Beziehungstherapeut bei Joi AI, stellt klar, dass diese nicht dazu gedacht sind, das Menschen C zu ersetzen C.

AI verschlimmert das Bot -Problem des Internets. Dieses Startup von 2 Milliarden US -Dollar liegt an vorderster FrontMay 01, 2025 am 11:16 AM

Online -Betrug und Bot -Angriffe stellen eine bedeutende Herausforderung für Unternehmen dar. Einzelhändler bekämpfen Bots, die Produkte horten, Banken Battle Account Takeovers und Social -Media -Plattformen kämpfen mit Imitatoren. Der Aufstieg von AI verschärft dieses Problem, das Rende

Verkauf an Roboter: Die Marketing -Revolution, die Ihr Geschäft herstellt oder brechen wirdMay 01, 2025 am 11:15 AM

AI -Agenten sind bereit, das Marketing zu revolutionieren und möglicherweise die Auswirkungen früherer technologischer Verschiebungen zu übertreffen. Diese Agenten, die einen signifikanten Fortschritt in der generativen KI darstellen, verarbeiten nicht nur Informationen wie Chatgpt, sondern auch Actio

Wie die Computer -Vision -Technologie NBA Playoff amtiertMay 01, 2025 am 11:14 AM

Die Auswirkungen der KI auf wichtige Entscheidungen von NBA Game 4 Zwei entscheidende NBA-Matchups in Game 4 zeigten die bahnbrechende Rolle der KI beim Amtieren. Im ersten Fall führte Denvers verpasste Drei-Zeiger von Nikola Jokic zu einer Gasse in der letzten Sekunden von Aaron Gordon. Sony's Haw

Wie KI die Zukunft der regenerativen Medizin beschleunigtMay 01, 2025 am 11:13 AM

Traditionell forderte die weltweit expandierende Expertin der regenerativen Medizin umfangreiche Reisen, praktische Ausbildung und jahrelange Mentoring. Jetzt verändert AI diese Landschaft, überwindet geografische Einschränkungen und beschleunigte Fortschritte durch EN

Key Takeaways von Intel Foundry Direct Connect 2025May 01, 2025 am 11:12 AM

Intel arbeitet daran, seinen Herstellungsprozess in die führende Position zurückzugeben, während er versucht, Fab -Semiconductor -Kunden anzuziehen, um Chips an seinen Fabriken herzustellen. Zu diesem Zweck muss Intel mehr Vertrauen in die Branche aufbauen, um nicht nur die Wettbewerbsfähigkeit seiner Prozesse zu beweisen, sondern auch zu demonstrieren, dass Partner Chips in einer vertrauten und ausgereiften Workflow, konsistente und sehr zuverlässige Weise herstellen können. Alles, was ich heute höre, lässt mich glauben, dass Intel dieses Ziel zu diesem Ziel bewegt. Die Keynote -Rede des neuen CEO Tan Libai begann den Tag. Tan Libai ist unkompliziert und prägnant. Er skizziert mehrere Herausforderungen in den Foundry -Diensten von Intel und die Maßnahmen, die Unternehmen ergriffen haben, um diese Herausforderungen zu bewältigen und einen erfolgreichen Weg für Intel Foundry Services in Zukunft zu planen. Tan Libai sprach über den Prozess des OEM -Dienstes von Intel, um Kunden mehr zu machen

Ai schief gegangen? Jetzt ist dafür eine Versicherung dafürMay 01, 2025 am 11:11 AM

Die Chaucer Group, ein globales Spezialversicherungsunternehmen, und Armilla AI haben sich mit den wachsenden Bedenken hinsichtlich der KI-Risiken befassen, und Armilla AI haben sich zusammengeschlossen, um ein neuartiges Versicherungsprodukt von Drittanbietern (TPL) einzubringen. Diese Richtlinie schützt Unternehmen vor

See all articles

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

Video Face Swap

Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Was ist neu in Windows 11 KB5054979 und wie Sie Update -Probleme beheben

4 Wochen vorByDDD

Wie kann ich KB5055523 in Windows 11 nicht installieren?

3 Wochen vorByDDD

Inzoi: Wie man sich für Schule und Universität bewerbt

1 Monate vorByDDD

Wie kann ich KB5055518 in Windows 10 nicht installieren?

3 Wochen vorByDDD

Wo finden Sie den Site Office -Schlüssel in Atomfall

4 Wochen vorByDDD

Heiße Werkzeuge

MinGW – Minimalistisches GNU für Windows

Dieses Projekt wird derzeit auf osdn.net/projects/mingw migriert. Sie können uns dort weiterhin folgen. MinGW: Eine native Windows-Portierung der GNU Compiler Collection (GCC), frei verteilbare Importbibliotheken und Header-Dateien zum Erstellen nativer Windows-Anwendungen, einschließlich Erweiterungen der MSVC-Laufzeit zur Unterstützung der C99-Funktionalität. Die gesamte MinGW-Software kann auf 64-Bit-Windows-Plattformen ausgeführt werden.