RAG (Resprieval-Augmented Generation)는 정보 검색을 통합하여 큰 언어 모델 (LLM)을 강화합니다. 이를 통해 LLMS는 외부 지식 기반에 액세스 할 수 있으므로보다 정확하고 현재, 상황에 맞는 응답을 초래할 수 있습니다. 고급 래그 기술 인 CRAG (Crative Rag)는 검색된 문서에 대한 자기 반성 및 자체 평가 메커니즘을 도입하여 정확성을 더욱 향상시킵니다.
주요 학습 목표
이 기사는 다음과 같습니다.
- CRAG의 핵심 메커니즘과 웹 검색과의 통합.
- 이진 스코어링 및 쿼리 재 작성을 사용한 CRAG의 문서 관련성 평가.
- 크래그와 전통적인 걸레의 주요 차이점.
- Python, Langchain 및 Tavily를 사용한 실습 크래그 구현.
- 검색 및 응답 정확도를 최적화하기 위해 평가자, 쿼리 재 작성자 및 웹 검색 도구를 구성하는 실용적인 기술.
Data Science Blogathon의 일부로 게시.
목차
- Crag의 기본 메커니즘
- 크래그 대 전통 래그
- 실제 크래그 구현
- Crag의 도전
- 결론
- 자주 묻는 질문
Crag의 기본 메커니즘
CRAG는 웹 검색을 검색 및 생성 프로세스에 통합하여 LLM 출력의 신뢰성을 향상시킵니다 (그림 1 참조).
문서 검색 :
- 데이터 수집 : 관련 데이터가 색인화되고 웹 검색 도구 (예 : Tavily AI)는 실시간 데이터 검색을 위해 구성됩니다.
- 초기 검색 : 문서는 사용자의 쿼리를 기반으로 정적 지식 기반에서 검색됩니다.
관련성 평가 :
평가자는 검색된 문서 관련성을 평가합니다. 문서의 70% 이상이 관련이없는 것으로 간주되면 시정 조치가 시작됩니다. 그렇지 않으면 응답 생성이 진행됩니다.
웹 검색 통합 :
문서 관련성이 충분하지 않으면 Crag는 웹 검색을 사용합니다.
- 쿼리 정제 : 원래 쿼리는 웹 검색 결과를 최적화하도록 수정되었습니다.
- 웹 검색 실행 : Tavily AI와 같은 도구는 추가 데이터를 가져와 현재 및 다양한 정보에 대한 액세스를 보장합니다.
응답 생성 :
CRAG는 초기 검색 및 웹 검색의 데이터를 합성하여 일관되고 정확한 응답을 만듭니다.
크래그 대 전통 래그
Crag는 검증 된 문서에 의존하는 전통적인 래그와 달리 검색된 정보를 적극적으로 검증하고 개선합니다. CRAG는 종종 실시간 웹 검색을 통합하여 전통적인 Rag의 정적 지식 기반에 대한 의존과 달리 최신 정보에 대한 액세스를 제공합니다. 이로 인해 CRAG는 높은 정확도와 실시간 데이터 통합이 필요한 애플리케이션에 이상적입니다.
실제 크래그 구현
이 섹션에서는 Python, Langchain 및 Tavily를 사용한 크래그 구현에 대해 자세히 설명합니다.
1 단계 : 라이브러리 설치
필요한 라이브러리 설치 :
! PIP 설치 Tiktoken Langchain-Openai Langchainhub Chromadb langchain langgraph tavily-python ! pip install -qu pypdf langchain_community
2 단계 : API 키 구성
API 키 설정 :
OS 가져 오기 os.environ [ "tavily_api_key"] = "" " os.environ [ "Openai_api_key"] = "" "
3 단계 : 라이브러리 수입
필수 라이브러리 가져 오기 (간결성에 대해서는 코드가 생략되었지만 원래 예와 유사).
4 단계 : 문서 청킹 및 리트리버 생성
(Code는 간결하게 생략되었지만 Pypdfloader, recursivecharactertextsplitter, OpenAiembeddings 및 Chroma를 사용하여 원래 예와 유사합니다).
5 단계 : rag 체인 설정
hub.pull("rlm/rag-prompt")
및 ChatOpenAI
)를 사용하는 원래 예제와 유사하게 코드가 생략되었지만 원래 예와 유사합니다.
6 단계 : 평가자 설정
(Code는 Brevity에 대해서는 생략되었지만 Evaluator
클래스를 정의하고 평가를 위해 ChatOpenAI
사용을 사용하는 원래 예와 유사합니다).
7 단계 : 쿼리 재 작성자 설정
(Code는 간결성에 대해서는 생략되었지만 쿼리 재 작성을 위해 ChatOpenAI
사용하여 원래 예와 유사합니다).
8 단계 : 웹 검색 설정
langchain_community.tools.tavily_search import tavilysearchResults web_search_tool = tavilysearchresults (k = 3)
9-12 단계 : Langgraph 워크 플로 설정 및 실행
(간결성에 대해서는 코드가 생략되었지만 원래 예제와 개념적으로 유사하게, GraphState
, 함수 노드 ( retrieve
, generate
, evaluate_documents
, transform_query
, web_search
)를 정의하고 StateGraph
사용하여 연결) 전통적인 래그와의 최종 출력 및 비교도 개념적으로 유사합니다.
Crag의 도전
CRAG의 효과는 평가자의 정확성에 크게 의존합니다. 약한 평가자는 오류를 도입 할 수 있습니다. 확장 성과 적응성도 지속적인 업데이트 및 교육이 필요합니다. 웹 검색 통합은 편견이 있거나 신뢰할 수없는 정보의 위험을 도입하여 강력한 필터링 메커니즘이 필요합니다.
결론
CRAG는 LLM 출력 정확도와 신뢰성을 크게 향상시킵니다. 실시간 웹 데이터로 검색된 정보를 평가하고 보충하는 능력으로 인해 높은 정밀도 및 최신 정보를 요구하는 응용 프로그램에는 가치가 있습니다. 그러나 지속적인 정제는 평가자 정확도 및 웹 데이터 신뢰성과 관련된 문제를 해결하는 데 중요합니다.
주요 테이크 아웃 (원본과 유사하지만 간결함을 위해 다시 표시)
- CRAG는 현재 관련 정보에 대한 웹 검색을 사용하여 LLM 응답을 향상시킵니다.
- 평가자는 응답 생성을위한 고품질 정보를 보장합니다.
- 쿼리 변환은 웹 검색 결과를 최적화합니다.
- Crag는 기존 걸레와 달리 실시간 웹 데이터를 동적으로 통합합니다.
- 크래그는 정보를 적극적으로 검증하여 오류를 줄입니다.
- CRAG는 높은 정확도와 실시간 데이터가 필요한 응용 프로그램에 유리합니다.
자주 묻는 질문 (원본과 유사하지만 간결함을 위해 다시 표시)
- Q1 : 크래그는 무엇입니까? A : 개선 된 정확도와 안정성을 위해 웹 검색을 통합하는 고급 래그 프레임 워크.
- Q2 : 크래그 대 전통 헝겊? A : CRAG는 검색된 정보를 적극적으로 확인하고 개선합니다.
- Q3 : 평가자의 역할? A : 문서 관련성 평가 및 수정을 유발합니다.
- Q4 : 문서가 충분하지 않습니까? A : 웹 검색이있는 크래그 보충제.
- Q5 : 신뢰할 수없는 웹 컨텐츠 처리? A : 고급 필터링 방법이 필요합니다.
(참고 : 이미지는 변경되지 않고 원래 입력에 포함되어 있습니다.)
위 내용은 실행중인 시정 걸레 (Crag)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

Chatgpt와 같은 챗봇에서 예시 된 Generative AI는 프로젝트 관리자에게 워크 플로를 간소화하고 프로젝트가 일정과 예산 내에서 유지되도록 강력한 도구를 제공합니다. 그러나 올바른 프롬프트를 제작하는 데 효과적으로 사용됩니다. 정확하고 세부 사항

인공 일반 지능 (AGI)을 정의하는 과제는 중요합니다. AGI 진보에 대한 주장에는 종종 정의 된 연구 방향에 맞게 정의 된 정의와 함께 명확한 벤치 마크가 부족합니다. 이 기사는 정의에 대한 새로운 접근법을 탐구합니다

IBM WATSONX.DATA : 엔터프라이즈 AI 데이터 스택을 간소화합니다 IBM은 Watsonx.data를 정확하고 확장 가능한 생성 AI 솔루션의 전달을 가속화하기위한 기업을위한 중추 플랫폼으로 위치합니다. 이것은 불만을 단순화하여 달성됩니다

AI와 재료 과학의 혁신으로 인해 로봇 공학의 급속한 발전은 새로운 휴머노이드 로봇 시대를 안내 할 준비가되어 있습니다. 수년 동안 산업 자동화는 주요 초점 이었지만 로봇의 기능은 빠르게 exp입니다.

10 년 만에 Netflix 인터페이스의 가장 큰 업데이트 : 더 똑똑하고 개인화 된 다양한 콘텐츠 수용 Netflix는 10 년 만에 사용자 인터페이스의 최대 개정을 발표했으며, 새로운 모습뿐만 아니라 각 쇼에 대한 더 많은 정보를 추가하고, "주변"및보다 유연한 구조와 같은 모호한 개념을 이해할 수있는 더 스마트 한 AI 검색 도구를 소개하여 비디오 게임, 라이브 이벤트, 스포츠 이벤트 및 기타 새로운 유형의 컨텐츠를 더 잘 보여줍니다. 트렌드를 따라 잡기 위해 모바일의 새로운 수직 비디오 구성 요소를 사용하면 팬이 트레일러와 클립을 쉽게 스크롤하거나 전체 쇼를 보거나 다른 사람들과 콘텐츠를 공유 할 수 있습니다. 이것은 무한한 스크롤과 매우 성공적인 짧은 비디오 웹 사이트 ti를 상기시킵니다.

인공 지능에서 일반 정보 (AGI)에 대한 논의가 커지면 인공 지능이 인간 지능을 능가 할 때 어떤 일이 발생하는지 생각해 보았습니다. 이 순간이 가까운지 또는 멀리 떨어져 있는지 여부는 당신이 물어 보는 사람에 달려 있지만, 그것이 우리가 집중해야 할 가장 중요한 이정표라고 생각하지 않습니다. 어떤 초기 AI 이정표가 모든 사람에게 영향을 미칩니 까? 어떤 이정표가 달성 되었습니까? 내가 생각한 세 가지가 있습니다. 인공 지능은 인간의 약점을 능가합니다 2022 년 영화 "Social Dilemma"에서 Humane Technology Center의 Tristan Harris는 인공 지능이 인간의 약점을 능가했다고 지적했다. 이것이 무엇을 의미합니까? 이것은 인공 지능이 인간을 사용할 수 있음을 의미합니다.

TransUnion의 CTO 인 Ranganath Achanta는 2021 년 후반 Neustar 인수 후 회사에 합류 한 이후 상당한 기술 변화를 주도했습니다. 다양한 부서의 7,000 명 이상의 직원들에 대한 그의 리더십

신뢰 구축은 비즈니스에서 성공적인 AI 채택을 위해 가장 중요합니다. 이것은 비즈니스 프로세스 내에서 인적 요소를 고려할 때 특히 사실입니다. 다른 사람과 마찬가지로 직원은 AI와 그 구현에 대한 우려를 주었다. Deloitte 연구원은 SC입니다


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

SublimeText3 Linux 새 버전
SublimeText3 Linux 최신 버전

WebStorm Mac 버전
유용한 JavaScript 개발 도구

ZendStudio 13.5.1 맥
강력한 PHP 통합 개발 환경

맨티스BT
Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.