DeepSeek R1을 사용하여 Rag 시스템을 구축하는 방법은 무엇입니까?-일체 포함-php.cn

집

기술 주변기기

일체 포함

DeepSeek R1을 사용하여 Rag 시스템을 구축하는 방법은 무엇입니까?

William Shakespeare

Mar 07, 2025 am 09:39 AM

나는 Rag 및 AI 에이전트에 대해 많이 읽었지만 DeepSeek V3 및 DeepSeek R1과 같은 새로운 모델이 출시되면 효율적인 RAG 시스템을 구축 할 가능성이 상당히 개선되어 더 나은 검색 정확도, 강화 된 추론 기능 및 실제 응용 프로그램에 대한 확장 가능한 아키텍처를 제공하는 것으로 보입니다. 보다 정교한 검색 메커니즘, 향상된 미세 조정 옵션 및 멀티 모달 기능의 통합은 AI 에이전트가 데이터와 상호 작용하는 방식을 변경하고 있습니다. 전통적인 래그 접근 방식이 여전히 최선의 방법인지 또는 새로운 아키텍처가보다 효율적이고 상황에 맞는 솔루션을 제공 할 수 있는지에 대한 의문을 제기합니다. 검색 증거 생성 (RAG)

시스템은 AI 모델이 검색 기반 및 생성 접근법을 결합하여보다 정확하고 상황을 인식하는 응답을 생성함으로써 데이터와 상호 작용하는 방식에 혁명을 일으켰습니다. 효율성과 비용 효율성으로 유명한 Deepseek R1

의 출현으로 효과적인 걸레 시스템을 구축하는 것이 더욱 접근 가능하고 실용화되었습니다. 이 기사에서는 DeepSeek R1을 사용하여 Rag 시스템을 구축하고 있습니다. 목차

Deepseek R1? RAG 시스템에 DeepSeek R1을 사용하는 것의 이점

DeepSeek r1

Deepseek r1은 무엇입니까?

DeepSeek R1 는 OpenAI의 오퍼링과 같은 독점 모델 비용의 일부에서 고품질 추론 및 검색 기능을 제공한다는 목표로 개발 된 오픈 소스 AI 모델입니다. MIT 라이센스가있어 상업적으로 실행 가능하고 광범위한 응용 프로그램에 적합합니다. 또한이 강력한 모델은 침대를 볼 수 있지만 Openai O1 및 O1-Mini에는 어떤 추론 토큰이 표시되지 않습니다.

Deepseek R1이 OpenAi O1 모델에 얼마나 도전하는지 알기 위해 : DeepSeek R1 vs Openai O1 : 어느 것이 더 빠르고, 저렴하며, 더 똑똑한가?

헝겊 시스템 에 DeepSeek R1을 사용하는 이점 DeepSeek-R1을 사용하는 검색 방지 생성 (RAG) 시스템 구축은 몇 가지 주목할만한 이점을 제공합니다. 1. 고급 추론 능력

: DeepSeek-R1은 결론에 도달하기 전에 정보를 단계별로 분석하고 처리하여 인간과 같은 추론을 모방합니다. 이 접근법은 복잡한 쿼리, 특히 논리적 추론, 수학적 추론 및 코딩 작업이 필요한 영역에서 복잡한 쿼리를 처리하는 시스템의 능력을 향상시킵니다.

2. Open-Source Accessibility : MIT 라이센스에 따라 출시 된 DeepSeek-R1은 완전히 오픈 소스로 개발자가 모델에 대한 무제한 액세스를 가능하게합니다. 이 개방성은 독점 모델과 관련된 제약 조건없이 사용자 정의, 미세 조정 및 다양한 응용 프로그램에 통합 할 수 있습니다. 3. 경쟁력있는 성능

: 벤치 마크 테스트에 따르면 DeepSeek-R1은 추론, 수학 및 코딩과 관련된 작업에서 OpenAI의 O1과 같은 모델과 동등한 모델과 동등하거나 심지어 능가하는 것으로 나타났습니다. 이 수준의 성능은 DeepSeek-R1로 구축 된 Rag 시스템이 다양하고 도전적인 쿼리에서 고품질의 정확한 응답을 제공 할 수 있도록합니다. 4. 사고 과정에서의 투명성 :

deepseek-r1
는“사슬의 사슬”방법론을 사용하여 추론 중에 추론 단계가 보이게합니다. 이 투명성은 의사 결정 프로세스에 대한 명확한 통찰력을 제공함으로써 사용자 신뢰를 구축하면서 시스템을 디버깅하고 개선하는 데 도움이됩니다. 5. 비용 효율성 : DeepSeek-R1의 오픈 소스 특성은 라이센스 비용을 제거하고 효율적인 아키텍처는 계산 자원 요구 사항을 줄입니다. 이러한 요소는 상당한 비용을 발생시키지 않고 정교한 걸레 시스템을 구현하려는 조직에보다 비용 효율적인 솔루션에 기여합니다. DeepSeek-R1을 RAG 시스템에 통합하는 것은 고급 추론 능력, 투명성, 성능 및 비용 효율성의 강력한 조합을 제공하여 AI 기능을 향상시키기 위해 개발자와 조직에 강력한 선택을 제공합니다. DeepSeek r1 를 사용하여 Rag 시스템을 구축하는 단계 스크립트는 다음과 같은 검색된 세대 생성 (RAG) 파이프 라인입니다 PDF 문서를 페이지로 나누고 텍스트를 추출하여 PDF 문서를로드하고 처리합니다. 데이터베이스 (ChromADB)에있는 텍스트의 벡터 표현을 저장합니다. 관련 내용을 검색 유사성 검색을 사용하여 쿼리를 요청할 때. 는 LLM (DeepSeek Model)을 사용하여 검색된 텍스트를 기반으로 응답을 생성합니다.
전제 조건을 설치하십시오
다운로드 ollama : 다운로드하려면 여기를 클릭하십시오 Linux 사용자의 경우 :
터미널에서 다음 명령을 실행하십시오

이 후에 딥스 r1 : 1.5b를 잡아 당깁니다
이것은 다운로드하는 데 잠시 시간이 걸립니다 :
이 작업을 수행 한 후 Jupyter 노트북을 열고 코딩 부분부터 시작하십시오.
1. 종속성을 설치하십시오 실행하기 전에 스크립트는 필요한 파이썬 라이브러리를 설치합니다
langchain → 대형 언어 모델 (LLMS)을 사용하여 응용 프로그램을 구축하기위한 프레임 워크. Langchain-Openai → Openai 서비스와 통합을 제공합니다 Langchain-Community → 다양한 문서 로더 및 유틸리티에 대한 지원을 추가합니다. Langchain-Chroma → 벡터 데이터베이스 인 ChromADB와의 통합을 가능하게합니다

2. OpenAI API 키 를 입력하십시오 OpenAi의 임베딩 모델에 액세스하기 위해 스크립트는 getpass ()를 사용하여 API 키
를 안전하게 입력하도록 촉구합니다. 이것은 평범한 텍스트로 자격 증명을 노출시키는 것을 방지합니다
3. 환경 변수를 설정 스크립트
는 API 키 를 환경 변수로 저장합니다. 이를 통해 코드의 다른 부분은 하드 코딩 자격 증명없이 OpenAI 서비스에 액세스 할 수 있으며, 이는 보안을 향상시킵니다.

4. OpenAi 임베딩을 초기화하십시오 스크립트는 "Text-embedding-3 Small"이라는 OpenAI 임베딩 모델을 초기화합니다. 이 모델은 텍스트를 텍스트의 의미의 고차원 수치 표현 인 벡터 임베딩 로 변환합니다. 이 임베딩은 나중에

비교하고 유사한 내용을 검색하는 데 사용됩니다.
5. PDF 문서를로드하고 분할하십시오 PDF 파일 (Agenticai.pdf)이
로드되어 페이지 로 분할됩니다. 각 페이지 텍스트가 추출되어 전체 문서를 단일 단위로 처리하는 대신
더 작고 관리하기 쉬운 텍스트 청크 가 허용됩니다. 6. 벡터 데이터베이스를 생성하고 저장하십시오
PDF에서 추출 된 텍스트는
벡터 임베딩으로 변환됩니다. 이 임베딩은

에 저장됩니다. 데이터베이스는 코사인 유사성을 사용하여 를 사용하여 의미 론적 유사성이 높은 텍스트의 효율적인 검색을 보장합니다. 7. 유사성 임계 값을 사용하여 유사한 텍스트를 검색하십시오 a
리트리버 는 chromADB를 사용하여 생성됩니다 주어진 쿼리를 기반으로하는 3 가지 가장 유사한
문서를 검색합니다. 는 0.3의 유사성 임계 값을 기준으로 결과를 필터링합니다. 즉, 문서는 관련 자격을 갖추려면 적어도 30% 유사성을 가져야합니다. 8. 유사한 문서에 대한 쿼리 두 가지 테스트 쿼리가 사용됩니다 :
"인도의 오래된 수도는 무엇입니까?"
결과가 발견되지 않았으며, 저장된 문서에 관련 정보가 포함되어 있지 않음을 나타냅니다.

"에이전트 AI는 무엇입니까?" 관련 텍스트를 성공적으로 검색하여 시스템이 의미있는 맥락을 가져올 수 있음을 보여줍니다.
9. 헝겊 (검색 침전 생성) 체인 를 건설하십시오 스크립트는

텍스트 검색 는 답을 생성하기 전에 발생합니다 모델의 응답은 검색 된 내용을 엄격히 기반으로 에 기초하여 환각을 방지합니다.

a 프롬프트 템플릿 는 모델에 구조화 된 응답을 생성하도록 지시하는 데 사용됩니다.

10. LLM (DeepSeek Model)에 연결을로드하십시오 OpenAi의 gpt 대신 스크립트

는 DeepSeek-R1 (1.5b 매개 변수)을로드합니다. 11. 헝겊 기반 체인 를 만듭니다 검색 모듈은 에 사용됩니다

벡터 데이터베이스에서 관련 컨텐츠를 가져 오십시오

프롬프트 템플릿을 사용하여 구조화 된 응답을 형식화하십시오

깊은 모델과 함께 간결한 답변

를 생성하십시오 12. 헝겊 체인을 테스트하십시오 스크립트는 테스트 쿼리를 실행합니다.

llm은 검색된 컨텍스트를 사용하여 사실 기반 응답을 생성합니다.

시스템은

가 데이터베이스에서 관련 정보를 검색합니다 DeepSeek r1

를 사용하여 Rag 시스템을 구축하는 코드 코드는 다음과 같습니다 <and> OpenAi 및 Langchain 의존성을 설치하십시오 <strong> <i> 열기 AI API 키 를 입력하십시오 </i></strong></and>

설정 환경 변수 ai 임베딩 모델을 열어 벡터 db를 만들고 디스크 에 지속됩니다 임계 값 검색과 유사성 래그 체인 를 만듭니다 llm rag 체인 에 대한 Langchain 구문 DeepSeek 작업 및 유사한 모델과의 비교에 대한 자세한 기사를 확인하십시오 : Deepseek R1- Openai의 O1 최대 경쟁자는 여기에 있습니다! DeepSeek-v3 를 사용한 AI 애플리케이션 구축 deepseek-v3 vs gpt-4o vs llama 3.3 70b Deepseek v3 vs gpt-4o : 어느 것이 더 낫습니까? Deepseek R1 vs Openai O1 : 어느 것이 더 낫습니까? DeepSeek Janus Pro 7b에 액세스하는 방법? 결론 DeepSeek r1 를 사용하여 Rag 시스템을 구축하면 문서 검색 및 응답 생성을 향상시키는 비용 효율적이고 강력한 방법을 제공합니다. 오픈 소스 특성과 강력한 추론 능력을 갖춘 독점 솔루션의 대안입니다. 비즈니스와 개발자는 유연성을 활용하여 자신의 요구에 맞는 AI 중심 애플리케이션을 만들 수 있습니다. DeepSeek을 사용하여 응용 프로그램을 구축하고 싶습니까? 오늘 우리의 무료 DeepSeek 코스를 체크 아웃하십시오!

위 내용은 DeepSeek R1을 사용하여 Rag 시스템을 구축하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

마찰에서 흐름까지 : AI가 법적 작업을 재구성하는 방법May 09, 2025 am 11:29 AM

법률 기술 혁명은 법률 전문가가 AI 솔루션을 적극적으로 수용하도록 추진력을 얻고 있습니다. 수동 저항은 더 이상 경쟁력을 유지하려는 사람들에게는 실행 가능한 옵션이 아닙니다. 기술 채택이 중요한 이유는 무엇입니까? 법률 전문가

이것이 Ai가 당신을 생각하고 당신에 대해 알고있는 것입니다.May 09, 2025 am 11:24 AM

많은 사람들은 AI와의 상호 작용이 익명이며 인간의 의사 소통과는 대조적이라고 가정합니다. 그러나 AI는 모든 채팅 중에 사용자를 적극적으로 프로파일 링합니다. 모든 프롬프트, 모든 단어는 분석 및 분류됩니다. AI Revo 의이 중요한 측면을 살펴 보겠습니다

번성하고 준비된 기업 문화를 구축하기위한 7 단계May 09, 2025 am 11:23 AM

성공적인 인공 지능 전략은 강력한 기업 문화 지원과 분리 될 수 없습니다. Peter Drucker가 말했듯이 비즈니스 운영은 사람들에게 달려 있으며 인공 지능의 성공도 마찬가지입니다. 인공 지능을 적극적으로 수용하는 조직의 경우 AI에 적응하는 기업 문화를 구축하는 것이 중요하며 AI 전략의 성공 또는 실패조차 결정합니다. West Monroe는 최근에 번성하는 AI 친화적 인 기업 문화를 구축하기위한 실용적인 가이드를 발표했으며 다음은 다음과 같습니다. 1. AI의 성공 모델을 명확하게 설명하십시오. 우선, AI가 비즈니스를 강화할 수있는 방법에 대한 명확한 비전이 있어야합니다. 이상적인 AI 운영 문화는 인간과 AI 시스템 간의 작업 프로세스를 자연스럽게 통합 할 수 있습니다. AI는 특정 작업에 능숙하지만 인간은 창의성과 판단에 능숙합니다.

Netflix New Scroll, Meta AI AI의 게임 체인저, Neuralink는 85 억 달러에 달했습니다.May 09, 2025 am 11:22 AM

메타 업그레이드 AI 보조 응용 프로그램 및 웨어러블 AI의 시대가오고 있습니다! ChatGpt와 경쟁하도록 설계된이 앱은 텍스트, 음성 상호 작용, 이미지 생성 및 웹 검색과 같은 표준 AI 기능을 제공하지만 이제 지리적 위치 기능을 처음으로 추가했습니다. 이것은 메타 AI가 자신의 위치와 질문에 대답 할 때보고있는 내용을 알고 있음을 의미합니다. 귀하의 관심사, 위치, 프로필 및 활동 정보를 사용하여 이전에는 불가능한 최신 상황 정보를 제공합니다. 이 앱은 또한 실시간 번역을 지원하여 Ray-Ban 안경의 AI 경험을 완전히 바꾸고 유용성을 크게 향상 시켰습니다. 외국 영화에 대한 관세 부과는 미디어와 문화에 대한 권력의 알몸 운동입니다. 구현되면 AI 및 가상 프로덕션으로 가속됩니다.

오늘이 단계를 수행하여 AI 사이버 범죄로부터 자신을 보호하십시오.May 09, 2025 am 11:19 AM

인공 지능은 사이버 범죄 분야를 혁신하여 새로운 방어 기술을 배우도록 강요하고 있습니다. 사이버 범죄자들은 깊은 위조 및 지능형 사이버 공격과 같은 강력한 인공 지능 기술을 사용하여 전례없는 규모로 사기 및 파괴를 사용하고 있습니다. 글로벌 비즈니스의 87%가 지난해 AI 사이버 범죄를 목표로 한 것으로보고되었습니다. 그렇다면이 현명한 범죄의 물결의 희생자가되는 것을 어떻게 피할 수 있습니까? 개인 및 조직 차원에서 위험을 식별하고 보호 조치를 취하는 방법을 살펴 보겠습니다. 사이버 범죄자가 인공 지능을 사용하는 방법 기술이 발전함에 따라 범죄자들은 개인, 기업 및 정부를 공격 할 수있는 새로운 방법을 지속적으로 찾고 있습니다. 인공 지능의 광범위한 사용은 최신 측면 일 수 있지만 잠재적 인 피해는 전례가 없습니다. 특히 인공 지능

공생 춤 : 인공 및 자연 인식의 고리 탐색May 09, 2025 am 11:13 AM

인공 지능 (AI)과 인간 지능 (NI) 사이의 복잡한 관계는 피드백 루프로 가장 잘 이해됩니다. 인간은 AI를 만들어 인간 활동에 의해 생성 된 데이터에 대해 인간 능력을 향상 시키거나 복제합니다. 이 ai

AI의 가장 큰 비밀 - 제작자는 이해하지 못하고 전문가가 분할May 09, 2025 am 11:09 AM

최첨단 AI 모델을 둘러싼 이해의 부족을 강조한 Anthropic의 최근 진술은 전문가들 사이에서 격렬한 논쟁을 불러 일으켰습니다. 이 불투명도는 진정한 기술 위기입니까, 아니면 단순히 더 많은 소프로가는 길에 일시적인 장애물입니까?

Sarvam AI의 Bulbul-V2 : 인도 최고의 TTS 모델May 09, 2025 am 10:52 AM

인도는 풍부한 언어 태피스트리를 가진 다양한 국가로 지역 간의 원활한 의사 소통을 지속적으로 도전합니다. 그러나 Sarvam의 Bulbul-V2

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.