>기술 주변기기 >일체 포함 >Chroma, Ollama 및 Gradio가있는 Deepseek-R1 Rag Chatbot

Chroma, Ollama 및 Gradio가있는 Deepseek-R1 Rag Chatbot

Joseph Gordon-Levitt
Joseph Gordon-Levitt원래의
2025-02-28 16:36:11785검색

이 튜토리얼은 DeepSeek-R1 및 Langchain을 사용하여 검색 증강 생성 (RAG) 챗봇을 구축하는 것을 보여줍니다. 챗봇은 지식 기반,이 경우 LLM의 기초에 관한 책을 기반으로 질문에 답변합니다. 이 프로세스는 사용자 친화적 인 Gradio 인터페이스를 통해 제공되는 정확하고 상황에 맞는 응답에 대한 DeepSeek-R1의 효율적인 벡터 검색을 활용합니다. Deepseek-R1의 고성능 검색, 세밀한 관련성 순위, 비용 효율성 (로컬 실행으로 인해), Chroma와의 쉬운 통합 및 오프라인 기능을 포함한 Deepseek-R1의 강점은이 응용 프로그램에 이상적입니다.

튜토리얼은 명확한 단계로 나뉩니다 1. 전제 조건 :

필요한 라이브러리 보장 (Langchain, Chromadb, Gradio, Ollama, Pymupdf)이 설치됩니다.

2. PDF로드 :

Langchain에서 Pymupdfloader를 사용하여 "LLMS의 기초"PDF에서 텍스트를 추출합니다. 3. 텍스트 청킹 : 추출 된 텍스트를 개선 된 컨텍스트 검색을 위해

를 사용하여 추출 된 텍스트를 더 작은 겹치는 덩어리로 분할하십시오.

4. 임베딩 생성 : DeepSeek-R1을 사용하여 Ollamaembeddings를 사용하여 각 청크에 대한 임베딩 생성.

를 통한 병렬화는이 과정을 속도를 높입니다. 참고 : 튜토리얼은 다양한 DeepSeek-R1 모델 크기 (7B, 8B, 14B 등)를 지정하는 기능을 언급합니다. 5. Chroma에 내장을 저장 : 효율적인 검색을 위해 Chroma 벡터 데이터베이스에 임베딩 및 해당 텍스트 청크를 저장합니다. 튜토리얼은 충돌을 방지하기 위해 컬렉션을 작성 및/또는 삭제하는 것을 강조합니다. 6. 리트리버 초기화 : 쿼리 처리를 위해 DeepSeek-R1 임베딩을 사용하여 Chroma 리트리버 설정. 7. Rag Pipeline (Context Retrieval) : 기능

는 사용자의 질문에 따라 관련 텍스트 청크를 검색합니다.

8. Querying DeepSeek-r1 : > 함수 는 사용자의 질문을 형식화하고 컨텍스트를 검색하고 Ollama를 통해 DeepSeek-R1로 보내고 프레젠테이션에 대한 응답을 정리합니다. 9. Gradio 인터페이스 : Gradio를 사용하여 대화식 인터페이스 생성을 통해 사용자가 질문을 입력하고 RAG 파이프 라인으로부터 답변을받을 수 있습니다.

최적화 :

튜토리얼은 청크 크기 조정, 더 작은 DeepSeek-R1 모델 사용, 더 큰 데이터 세트 용 FAISS 통합 및 삽입 생성을위한 배치 처리를 포함한 몇 가지 최적화를 제안합니다. RecursiveCharacterTextSplitter 결론 :

튜토리얼은 기능적 지역 래그 챗봇 구축을 성공적으로 시연하여 효율적이고 정확한 정보 검색을 위해 DeepSeek-R1의 힘을 보여줍니다. 더 깊은 자원에 대한 링크가 제공됩니다

위 내용은 Chroma, Ollama 및 Gradio가있는 Deepseek-R1 Rag Chatbot의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.