이 안내서는 상황에 맞는 검색 증강 생성 (RAG) 시스템을 구축하여 상황 정보 및 하이브리드 검색 기술을 통합하여 표준 래그 접근 방식을 향상시킵니다. 표준 래그 시스템은 사용자 정의 데이터에 대한 질문에 응답하는 데 효율적이지만 문서 청킹으로 인한 컨텍스트 손실이 종종 있습니다. 이 개선 된 시스템은이 제한을 해결합니다.
목차 :
- 순진한 래그 건축
- 순진한 헝겊 제한
- 하이브리드 래그 워크 플로
- 상황에 맞는 검색이 설명되었습니다
- 상황 검색 구현
- 상황에 따라 검색 사전 프로세싱
- 하이브리드 검색 및 재고 아키텍처를 갖춘 상황에 맞는 헝겊
- 실습 구현 :
- 종속성 설치
- OpenAI API 키 입력
- 환경 변수 설정
- 데이터 세트 획득
- JSON Wikipedia 문서 처리
- 맥락 정보를 사용한 PDF 연구 논문 처리
- 벡터 데이터베이스 인덱싱 및 시맨틱 검색
- BM25 인덱싱 및 키워드 검색
- 앙상블 검색을 가진 하이브리드 검색
- RERANKER를 사용한 리트리버 향상
- 자주 묻는 질문
순진한 래그 건축 :
기본 걸레 시스템에는 다음이 포함됩니다.
- 데이터 처리 및 인덱싱 : 문서는 벡터 데이터베이스에로드, 청크, 내장 및 저장됩니다.
- 검색 및 응답 생성 : 사용자 쿼리가 처리되고, 유사한 청크가 검색되고, LLM은 검색된 컨텍스트를 사용하여 응답을 생성합니다.
순진한 걸레 한계 :
- 고립 된 청크로 인한 상황 정보 손실.
- 차선 검색 성능.
- 의미 적 유사성에만 의존합니다.
하이브리드 래그 워크 플로 :
이 접근법은 시맨틱과 키워드 검색을 결합합니다.
TF-IDF의 개선 인 BM25는 키워드 검색에 사용되어 문서 길이를 고려합니다. 두 방법의 결과는 상호 순위 융합 (RRF)을 사용하여 결합됩니다.
맥락 검색 :
이 기술은 대형 언어 모델 (LLM)에 의해 생성 된 컨텍스트 정보를 선물하여 청크 품질을 향상시킵니다. Anthropic의 연구는이 접근법의 이점을 강조합니다.
상황에 따라 검색 사전 처리 아키텍처 :
이 파이프 라인은 문서를 처리하고 청크를하고 LLM을 사용하여 상황에 맞는 정보를 생성 하며이 컨텍스트를 각 청크에 전제합니다. LLM 사용을위한 비용 최적화 전략에 대해 논의합니다.
하이브리드 검색 및 재창조 아키텍처를 갖춘 상황에 맞는 헝겊 :
이 아키텍처는 상황에 맞는 사전 처리, 하이브리드 검색 (시맨틱 및 키워드 검색), 앙상블 검색 (RRF) 및 재고 (BAAI/BGE-RERANKER-V2-M3과 같은 크로스 코더 모델 사용)를 개선 된 검색 정확도를 향상시킵니다.
실습 구현 : 이 섹션에서는 Langchain, PymupDF, ChromADB, BM25 및 OpenAI의 임베딩 및 LLM을 사용하여 코드 예제가 포함 된 상세한 단계별 안내서를 제공합니다. 코드는 데이터로드, 처리, 인덱싱, 검색 및 응답 생성을 다룹니다. 이 예는 Wikipedia 기사 및 연구 논문을 사용합니다. 샘플 쿼리로 파이프 라인을 테스트하면 시스템의 효과가 나타납니다.
결론 : 가이드는 하이브리드 검색 및 재고가있는 상황에 맞는 걸레 시스템의 구성을 성공적으로 보여 주며 순진한 걸레 시스템에 비해 개선 된 검색 정확도 및 응답 품질을 보여줍니다.
자주 묻는 질문 : 이 섹션에서는 Rag 시스템, 한계 및이 개선 된 아키텍처에 사용 된 기술에 대한 일반적인 질문에 답변합니다.
위 내용은 하이브리드 검색 및 재고가있는 상황에 맞는 걸레 시스템 구축의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

언어 모델은 세계에서 빠르게 진화하고 있습니다. 이제 멀티 모달 LLM 이이 언어 모델 경주의 최전선을 차지함에 따라 이러한 멀티 모달 모델의 기능을 활용할 수있는 방법을 이해하는 것이 중요합니다.

Microsoft는 OpenAi, Google 및 Meta와 같지 않습니다. 특히 큰 언어 모델에 있어서는 아닙니다. 다른 기술 거인은 선택한 사용자를 거의 압도하는 여러 모델을 선호하는 것을 선호합니다. Microsoft는 몇 가지를 출시합니다.

키 동작을 배울 때까지 Git은 퍼즐처럼 느낄 수 있습니다. 이 안내서에는 사용 빈도에 따라 상위 20 개의 GIT 명령을 찾을 수 있습니다. 각 항목은 빠른 "무엇을 하는가"요약으로 시작하고, 이미지 디스플레이가 이어집니다.

소프트웨어 개발에서 여러 기고자의 코드를 관리하면 지저분해질 수 있습니다. 여러 사람이 동시에 같은 문서를 편집하고 각각 새로운 아이디어를 추가하거나 버그 수정 또는 기능 조정 기능을 상상해보십시오. 구조물없이

PPTX, DOCX 또는 PDF와 같은 다른 형식은 Markdown 변환기에 대한 컨텐츠 작성자, 개발자 및 문서 전문가에게 필수적인 도구입니다. 올바른 도구를 사용하면 모든 유형의 변환 할 때 모든 차이가 있습니다.

Qwen은 다른 모델을 조용히 추가하고 있습니다. 각 모델에는 너무 큰 기능과 크기가 너무 커져서 양자화되어 무시할 수 없습니다. QVQ 이후, QWEN2.5-VL 및 QWEN2.5-OMNI 이후

AI 필드의 평가 지표로서 "VIBES"의 사용이 상승하는 것을 논의합시다. 이 분석은 AI 발전에 대한 진행중인 Forbes 열의 일부이며 AI 개발의 복잡한 측면을 탐색합니다 (여기 링크 참조). AI 평가의 분위기 트레이디

Waymo 's Arizona Factory : 대량 생산 자율 주행 재규어 및 그 이상 애리조나 주 피닉스 근처에 위치한 Waymo는 자율적 인 재규어 I-Pace Electric SUV를 생산하는 최첨단 시설을 운영하고 있습니다. 이 239,000 평방 피트 규모의 공장이 문을 열었습니다


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

mPDF
mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.

안전한 시험 브라우저
안전한 시험 브라우저는 온라인 시험을 안전하게 치르기 위한 보안 브라우저 환경입니다. 이 소프트웨어는 모든 컴퓨터를 안전한 워크스테이션으로 바꿔줍니다. 이는 모든 유틸리티에 대한 액세스를 제어하고 학생들이 승인되지 않은 리소스를 사용하는 것을 방지합니다.

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

VSCode Windows 64비트 다운로드
Microsoft에서 출시한 강력한 무료 IDE 편집기

DVWA
DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는