>기술 주변기기 >일체 포함 >DeepSeek R1을 사용하여 Rag 시스템을 구축하는 방법은 무엇입니까?

DeepSeek R1을 사용하여 Rag 시스템을 구축하는 방법은 무엇입니까?

William Shakespeare
William Shakespeare원래의
2025-03-07 09:39:11533검색
나는 Rag 및 AI 에이전트에 대해 많이 읽었지만 DeepSeek V3 및 DeepSeek R1과 같은 새로운 모델이 출시되면 효율적인 RAG 시스템을 구축 할 가능성이 상당히 개선되어 더 나은 검색 정확도, 강화 된 추론 기능 및 실제 응용 프로그램에 대한 확장 가능한 아키텍처를 제공하는 것으로 보입니다. 보다 정교한 검색 메커니즘, 향상된 미세 조정 옵션 및 멀티 모달 기능의 통합은 AI 에이전트가 데이터와 상호 작용하는 방식을 변경하고 있습니다. 전통적인 래그 접근 방식이 여전히 최선의 방법인지 또는 새로운 아키텍처가보다 효율적이고 상황에 맞는 솔루션을 제공 할 수 있는지에 대한 의문을 제기합니다. 검색 증거 생성 (RAG)

시스템은 AI 모델이 검색 기반 및 생성 접근법을 결합하여보다 정확하고 상황을 인식하는 응답을 생성함으로써 데이터와 상호 작용하는 방식에 혁명을 일으켰습니다. 효율성과 비용 효율성으로 유명한 Deepseek R1

의 출현으로 효과적인 걸레 시스템을 구축하는 것이 더욱 접근 가능하고 실용화되었습니다. 이 기사에서는 DeepSeek R1을 사용하여 Rag 시스템을 구축하고 있습니다. 목차

Deepseek R1? RAG 시스템에 DeepSeek R1을 사용하는 것의 이점

DeepSeek r1

r1
  • Deepseek r1은 무엇입니까?
  • DeepSeek R1 는 OpenAI의 오퍼링과 같은 독점 모델 비용의 일부에서 고품질 추론 및 검색 기능을 제공한다는 목표로 개발 된 오픈 소스 AI 모델입니다. MIT 라이센스가있어 상업적으로 실행 가능하고 광범위한 응용 프로그램에 적합합니다. 또한이 강력한 모델은 침대를 볼 수 있지만 Openai O1 및 O1-Mini에는 어떤 추론 토큰이 표시되지 않습니다. 

    Deepseek R1이 OpenAi O1 모델에 얼마나 도전하는지 알기 위해 : DeepSeek R1 vs Openai O1 : 어느 것이 더 빠르고, 저렴하며, 더 똑똑한가? 

    헝겊 시스템 에 DeepSeek R1을 사용하는 이점 DeepSeek-R1을 사용하는 검색 방지 생성 (RAG) 시스템 구축은 몇 가지 주목할만한 이점을 제공합니다. 1. 고급 추론 능력

    : DeepSeek-R1은 결론에 도달하기 전에 정보를 단계별로 분석하고 처리하여 인간과 같은 추론을 모방합니다. 이 접근법은 복잡한 쿼리, 특히 논리적 추론, 수학적 추론 및 코딩 작업이 필요한 영역에서 복잡한 쿼리를 처리하는 시스템의 능력을 향상시킵니다.

    2. Open-Source Accessibility : MIT 라이센스에 따라 출시 된 DeepSeek-R1은 완전히 오픈 소스로 개발자가 모델에 대한 무제한 액세스를 가능하게합니다. 이 개방성은 독점 모델과 관련된 제약 조건없이 사용자 정의, 미세 조정 및 다양한 응용 프로그램에 통합 할 수 있습니다. 3. 경쟁력있는 성능

    : 벤치 마크 테스트에 따르면 DeepSeek-R1은 추론, 수학 및 코딩과 관련된 작업에서 OpenAI의 O1과 같은 모델과 동등한 모델과 동등하거나 심지어 능가하는 것으로 나타났습니다. 이 수준의 성능은 DeepSeek-R1로 구축 된 Rag 시스템이 다양하고 도전적인 쿼리에서 고품질의 정확한 응답을 제공 할 수 있도록합니다. 4. 사고 과정에서의 투명성 :

    deepseek-r1

    는“사슬의 사슬”방법론을 사용하여 추론 중에 추론 단계가 보이게합니다. 이 투명성은 의사 결정 프로세스에 대한 명확한 통찰력을 제공함으로써 사용자 신뢰를 구축하면서 시스템을 디버깅하고 개선하는 데 도움이됩니다. 5. 비용 효율성 : DeepSeek-R1의 오픈 소스 특성은 라이센스 비용을 제거하고 효율적인 아키텍처는 계산 자원 요구 사항을 줄입니다. 이러한 요소는 상당한 비용을 발생시키지 않고 정교한 걸레 시스템을 구현하려는 조직에보다 비용 효율적인 솔루션에 기여합니다. DeepSeek-R1을 RAG 시스템에 통합하는 것은 고급 추론 능력, 투명성, 성능 및 비용 효율성의 강력한 조합을 제공하여 AI 기능을 향상시키기 위해 개발자와 조직에 강력한 선택을 제공합니다. DeepSeek r1 를 사용하여 Rag 시스템을 구축하는 단계 스크립트는 다음과 같은 검색된 세대 생성 (RAG) 파이프 라인입니다 PDF 문서를 페이지로 나누고 텍스트를 추출하여 PDF 문서를로드하고 처리합니다. 데이터베이스 (ChromADB)에있는 텍스트의 벡터 표현을 저장합니다. 관련 내용을 검색 유사성 검색을 사용하여 쿼리를 요청할 때. 는 LLM (DeepSeek Model)을 사용하여 검색된 텍스트를 기반으로 응답을 생성합니다.

    전제 조건을 설치하십시오

    다운로드 ollama : 다운로드하려면 여기를 클릭하십시오 Linux 사용자의 경우 :

    터미널에서 다음 명령을 실행하십시오

    이 후에 딥스 r1 : 1.5b를 잡아 당깁니다

    이것은 다운로드하는 데 잠시 시간이 걸립니다 :

    이 작업을 수행 한 후 Jupyter 노트북을 열고 코딩 부분부터 시작하십시오.

    1. 종속성을 설치하십시오 실행하기 전에 스크립트는 필요한 파이썬 라이브러리를 설치합니다

      langchain → 대형 언어 모델 (LLMS)을 사용하여 응용 프로그램을 구축하기위한 프레임 워크. Langchain-Openai → Openai 서비스와 통합을 제공합니다 Langchain-Community → 다양한 문서 로더 및 유틸리티에 대한 지원을 추가합니다. Langchain-Chroma → 벡터 데이터베이스 인 ChromADB와의 통합을 가능하게합니다
    • 2. OpenAI API 키 를 입력하십시오 OpenAi의 임베딩 모델에 액세스하기 위해 스크립트는 getpass ()를 사용하여 API 키
    • 를 안전하게 입력하도록 촉구합니다. 이것은 평범한 텍스트로 자격 증명을 노출시키는 것을 방지합니다
    • 3. 환경 변수를 설정 스크립트
    • 는 API 키 를 환경 변수로 저장합니다. 이를 통해 코드의 다른 부분은 하드 코딩 자격 증명없이 OpenAI 서비스에 액세스 할 수 있으며, 이는 보안을 향상시킵니다.
    • 4. OpenAi 임베딩을 초기화하십시오 스크립트는 "Text-embedding-3 Small"이라는 OpenAI 임베딩 모델을 초기화합니다. 이 모델은 텍스트를 텍스트의 의미의 고차원 수치 표현 인 벡터 임베딩 로 변환합니다. 이 임베딩은 나중에
    비교하고 유사한 내용을 검색하는 데 사용됩니다.

    5. PDF 문서를로드하고 분할하십시오 PDF 파일 (Agenticai.pdf)이

    로드되어 페이지 로 분할됩니다. 각 페이지 텍스트가 추출되어 전체 문서를 단일 단위로 처리하는 대신

    더 작고 관리하기 쉬운 텍스트 청크 가 허용됩니다. 6. 벡터 데이터베이스를 생성하고 저장하십시오

    PDF에서 추출 된 텍스트는

    벡터 임베딩으로 변환됩니다. 이 임베딩은

    에 저장됩니다. 데이터베이스는 코사인 유사성을 사용하여 를 사용하여 의미 론적 유사성이 높은 텍스트의 효율적인 검색을 보장합니다. 7. 유사성 임계 값을 사용하여 유사한 텍스트를 검색하십시오 a

    리트리버 는 chromADB를 사용하여 생성됩니다 주어진 쿼리를 기반으로하는 3 가지 가장 유사한

    문서를 검색합니다. 는 0.3의 유사성 임계 값을 기준으로 결과를 필터링합니다. 즉, 문서는 관련 자격을 갖추려면 적어도 30% 유사성을 가져야합니다. 8. 유사한 문서에 대한 쿼리 두 가지 테스트 쿼리가 사용됩니다 :

    "인도의 오래된 수도는 무엇입니까?"

    결과가 발견되지 않았으며, 저장된 문서에 관련 정보가 포함되어 있지 않음을 나타냅니다.

    "에이전트 AI는 무엇입니까?" 관련 텍스트를 성공적으로 검색하여 시스템이 의미있는 맥락을 가져올 수 있음을 보여줍니다.

    9. 헝겊 (검색 침전 생성) 체인 를 건설하십시오 스크립트는
  • 텍스트 검색 는 답을 생성하기 전에 발생합니다 모델의 응답은 검색 된 내용을 엄격히 기반으로 에 기초하여 환각을 방지합니다.
  • a 프롬프트 템플릿 는 모델에 구조화 된 응답을 생성하도록 지시하는 데 사용됩니다.
  • 10. LLM (DeepSeek Model)에 연결을로드하십시오 OpenAi의 gpt 대신 스크립트
  • 는 DeepSeek-R1 (1.5b 매개 변수)을로드합니다. 11. 헝겊 기반 체인 를 만듭니다 검색 모듈은 에 사용됩니다
  • 벡터 데이터베이스에서 관련 컨텐츠를 가져 오십시오

    프롬프트 템플릿을 사용하여 구조화 된 응답을 형식화하십시오

    깊은 모델과 함께 간결한 답변

    를 생성하십시오 12. 헝겊 체인을 테스트하십시오 스크립트는 테스트 쿼리를 실행합니다.

    llm은 검색된 컨텍스트를 사용하여 사실 기반 응답을 생성합니다.

    시스템은

    가 데이터베이스에서 관련 정보를 검색합니다 DeepSeek r1

    를 사용하여 Rag 시스템을 구축하는 코드 코드는 다음과 같습니다 <and> OpenAi 및 Langchain 의존성을 설치하십시오 <strong> <i> 열기 AI API 키 를 입력하십시오 </i></strong></and>

    설정 환경 변수
      ai 임베딩 모델을 열어 벡터 db를 만들고 디스크 에 지속됩니다 임계 값 검색과 유사성
    • 래그 체인 를 만듭니다 llm rag 체인
    에 대한 Langchain 구문

    DeepSeek 작업 및 유사한 모델과의 비교에 대한 자세한 기사를 확인하십시오 :
    Deepseek R1- Openai의 O1 최대 경쟁자는 여기에 있습니다! DeepSeek-v3 를 사용한 AI 애플리케이션 구축 deepseek-v3 vs gpt-4o vs llama 3.3 70b

    Deepseek v3 vs gpt-4o : 어느 것이 더 낫습니까? Deepseek R1 vs Openai O1 : 어느 것이 더 낫습니까? DeepSeek Janus Pro 7b에 액세스하는 방법?

    결론 DeepSeek r1

    를 사용하여 Rag 시스템을 구축하면 문서 검색 및 응답 생성을 향상시키는 비용 효율적이고 강력한 방법을 제공합니다. 오픈 소스 특성과 강력한 추론 능력을 갖춘 독점 솔루션의 대안입니다. 비즈니스와 개발자는 유연성을 활용하여 자신의 요구에 맞는 AI 중심 애플리케이션을 만들 수 있습니다.

    DeepSeek을 사용하여 응용 프로그램을 구축하고 싶습니까? 오늘 우리의 무료 DeepSeek 코스를 체크 아웃하십시오!

    위 내용은 DeepSeek R1을 사용하여 Rag 시스템을 구축하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

    성명:
    본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.