목차
rags 소개
agg 평가 : Rag Evaluation : "나에게 좋아 보인다"- 검색 성능을 평가하기위한 드라이버 메트릭 생성 성능을 평가하기위한 드라이버 메트릭 Rag의 실제 응용 프로그램 시스템 결론
-
래그 소개 Rag는 텍스트 생성 중에 외부 정보를 도입하여 LLM을 향상시킵니다. 여기에는 검색, 증강 및 세대의 세 가지 주요 단계가 포함됩니다. 먼저, 검색은 데이터베이스에서 관련 정보를 추출하여 종종 임베딩 (단어 또는 문서의 벡터 표현) 및 유사성 검색을 사용합니다. 증강시,이 검색된 데이터는 더 깊은 맥락을 제공하기 위해 LLM에 공급됩니다. 마지막으로, 세대는 풍부한 입력을 사용하여보다 정확하고 상황을 인식하는 출력을 생성하는 것이 포함됩니다. 이 과정은 LLM이 환각과 같은 제한을 극복하여 사실뿐만 아니라 실행 가능한 결과를 생성하는 데 도움이됩니다. 그러나 래그 시스템이 얼마나 잘 작동하는지 알기 위해서는 구조화 된 평가 프레임 워크가 필요합니다. - <:> Rag Evaluation :“나에게 좋아 보인다”를 넘어서 움직입니다 소프트웨어 개발에서“LGTM)는 비공식적 인 평가 메트릭이지만 일반적으로 사용되는 것으로 일반적으로 사용됩니다. 그러나 Rag 또는 AI 시스템의 성능이 얼마나 잘 수행되는지 이해하려면보다 엄격한 접근이 필요합니다. 평가는 목표 지표, 운전자 지표 및 운영 지표의 세 가지 수준을 중심으로 구축되어야합니다.
- 목표 지표 는 투자 수익률 (ROI) 또는 사용자 만족도와 같은 프로젝트 목표와 관련된 높은 수준의 지표입니다. 예를 들어, 향상된 사용자 유지는 검색 엔진에서 목표 메트릭이 될 수 있습니다. 드라이버 메트릭 는 검색 관련성 및 생성 정확도와 같은 목표 메트릭에 직접 영향을 미치는 구체적이고 더 빈번한 측정입니다. 운영 메트릭 대기 시간 및 가동 시간과 같이 시스템이 효율적으로 작동하는지 확인하십시오. rag (검색을 강화하는 생성)와 같은 시스템에서는 운전자 지표가 검색 및 생성의 성능을 평가하기 때문에 핵심입니다. 이 두 가지 요소는 사용자 만족도 및 시스템 효율성과 같은 전반적인 목표에 큰 영향을 미칩니다. 따라서이 기사에서는 드라이버 메트릭에 더 중점을 둘 것입니다.
-
검색 성능 평가를위한 드라이버 메트릭 검색은 LLM에 관련 맥락을 제공하는 데 중요한 역할을합니다. 정밀도, 리콜, MRR 및 NDCG와 같은 몇 가지 드라이버 메트릭은 RAG 시스템의 검색 성능을 평가하는 데 사용됩니다.
정밀도 - 정밀도 , 리콜 및 f1 와 같은 메트릭은 생성 된 텍스트를 참조 텍스트와 비교합니다. rouge 는 가장 긴 공통 후속을 측정합니다. 최종 출력에서 검색된 컨텍스트의 양이 얼마나 많이 유지되는지 평가합니다. Rouge 점수가 높을수록 생성 된 텍스트가 더 완전하고 관련이 있음을 나타냅니다. bleu 는 헝겊 시스템이 충분히 상세하고 상황이 풍부한 답변을 생성하는지 여부를 평가합니다. 검색된 정보의 전체 의도를 전달하지 못하는 불완전하거나 과도하게 간결한 응답을 처벌합니다. Semantic 유사성
- 는 임베딩을 사용하여 생성 된 텍스트가 참조와 개념적으로 정렬되는 방식을 평가합니다.
자연 언어 추론 (NLI) 생성 된 내용과 검색된 내용 사이의 논리적 일관성을 평가합니다.
Bleu와 Rouge와 같은 전통적인 지표는 유용하지만 종종 더 깊은 의미를 놓칩니다. 시맨틱 유사성과 NLI 자세히 알아보십시오 : 언어 모델 평가를 위해 정량적 메트릭을 단순화했습니다
-
래그 시스템의 원칙은 이미 산업을 변화시키고 있습니다. 다음은 가장 인기 있고 영향력있는 실제 응용 프로그램입니다. 1. 검색 엔진 검색 엔진에서 최적화 된 검색 파이프 라인은 관련성과 사용자 만족도를 향상시킵니다. 예를 들어, RAG는 응답을 생성하기 전에 광대 한 코퍼스에서 가장 관련성이 높은 정보를 검색하여 검색 엔진이보다 정확한 답변을 제공하도록 도와줍니다. 이를 통해 사용자는 일반 또는 구식 정보가 아닌 사실 기반의 상황에 맞는 정확한 검색 결과를 얻을 수 있습니다. 2. 고객 지원 -
고객 지원에서 Rag-Powered Chatbots는 상황에 맞는 정확한 응답을 제공합니다. 이 챗봇은 사전 프로그래밍 된 응답에만 의존하는 대신 FAQ, 문서 및 과거의 상호 작용에서 관련 지식을 동적으로 검색하여 정확하고 개인화 된 답변을 전달합니다. 예를 들어, 전자 상거래 챗봇은 Rag를 사용하여 주문 세부 사항을 가져 오거나, 문제 해결 단계를 제안하거나, 사용자의 쿼리 기록을 기반으로 관련 제품을 추천 할 수 있습니다.
3. 추천 시스템
컨텐츠 추천 시스템에서 Rag는 생성 된 제안이 사용자 선호도 및 요구에 맞게 연계됩니다. 예를 들어 스트리밍 플랫폼은 RAG를 사용하여 사용자가 좋아하는 것뿐만 아니라 정서적 참여를 기반으로 컨텐츠를 추천하여 더 나은 유지 및 사용자 만족도를 초래합니다. 4. 건강 관리 의료 응용 분야에서 RAG는 관련 의학 문헌, 환자 이력 및 진단 제안을 실시간으로 검색하여 의사를 지원합니다. 예를 들어, AI 기반 임상 조교는 RAG를 사용하여 최신 연구 연구를 당기고 유사한 문서화 된 사례와 환자의 증상을 상호 참조하여 의사가 정보에 근거한 치료 결정을 더 빨리 만들 수 있도록 도와줍니다. 5. 법률 연구
법률 연구 도구에서 Rag는 관련 판례법과 법적 선례를 가져와 문서 검토를보다 효율적으로 만듭니다. 예를 들어, 법률 회사는 래그로 구동되는 시스템을 사용하여 진행중인 사례와 관련된 과거의 판결, 법령 및 해석을 즉시 검색하여 수동 연구에 소요되는 시간을 줄일 수 있습니다. 6. 교육
e- 러닝 플랫폼에서 Rag는 개인화 된 연구 자료를 제공하고 선별 된 지식 기반을 기반으로 학생 쿼리에 동적으로 답변합니다. 예를 들어, AI 교사는 교과서, 과거 시험 서류 및 온라인 리소스에서 설명을 검색하여 학생 질문에 대한 정확하고 맞춤형 응답을 생성하여 학습보다 대화식적이고 적응력을 발휘할 수 있습니다. 결론 포스트잇 노트가 실패한 접착제를 변형 제품으로 바꾸었던 것처럼, 래그는 생성 AI에 혁명을 일으킬 가능성이 있습니다. 이 시스템은 정적 모델과 실시간 지식이 풍부한 반응 사이의 간격을 연결합니다. 그러나이 잠재력을 실현하려면 AI 시스템이 정확하고 관련성 있고 상황을 인식하는 출력을 생성 할 수 있도록 평가 방법론의 강력한 토대가 필요합니다. NDCG, 시맨틱 유사성 및 NLI와 같은 고급 메트릭을 활용하여 LLM 중심 시스템을 개선하고 최적화 할 수 있습니다. 목표, 드라이버 및 운영 메트릭을 포함하는 잘 정의 된 구조와 결합 된 이러한 메트릭은 조직이 AI 및 RAG 시스템의 성능을 체계적으로 평가하고 개선 할 수 있도록합니다.AI의 빠르게 진화하는 환경에서 진정으로 중요한 것을 측정하는 것은 잠재력을 성능으로 바꾸는 데 중요합니다. 올바른 도구와 기술을 사용하여 세계에 실질적인 영향을 미치는 AI 시스템을 만들 수 있습니다.
Recall
전체에 얼마나 많은 관련 문서가 검색되었는지 평가합니다 평균 상호 순위 (MRR)는 결과 목록에서 첫 번째 관련 문서의 순위를 측정하고 MRR이 높을수록 순위 시스템을 더 잘 나타냅니다. 정규화 된 할인 된 누적 이득 (NDCG)
는 검색된 모든 문서의 관련성과 위치를 모두 고려하여 순위가 높은 사람들에게 더 많은 가중치를 부여합니다.
위 내용은 RAG 성능을 측정하는 방법 : 드라이버 메트릭 및 도구의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

AI는 산불 복구 허가를 간소화합니다 기계 학습 및 컴퓨터 비전을 활용하는 호주 기술 회사 인 Archistar의 AI 소프트웨어는 지역 규정 준수를위한 건축 계획 평가를 자동화합니다. 이 예비 검증은 중요합니다

에스토니아의 디지털 정부 : 미국의 모델? 미국은 관료적 비 효율성과의 투쟁이지만 에스토니아는 설득력있는 대안을 제공합니다. 이 소규모 국가는 AI가 구동하는 거의 100% 디지털화 된 시민 중심 정부를 자랑합니다. 이것은 아닙니다

결혼식을 계획하는 것은 기념비적 인 일이며, 종종 가장 조직화 된 커플조차도 압도적입니다. AI의 영향에 관한 진행중인 Forbes 시리즈의 일부인이 기사 (여기 링크 참조)는 생성 AI가 결혼 계획에 혁명을 일으킬 수있는 방법을 탐구합니다. 결혼식 pl

기업은 AI 에이전트를 판매하기 위해 점점 더 활용하는 반면 정부는 다양한 기존의 작업에이를 활용합니다. 그러나 소비자 옹호자들은 개인이 자주 조정 된 사람들에 대한 방어로 자신의 AI 에이전트를 소유해야 할 필요성을 강조합니다.

Google은 이러한 변화를 이끌고 있습니다. "AI 개요"기능은 이미 10 억 명 이상의 사용자에게 제공되며, 누군가가 링크를 클릭하기 전에 완전한 답변을 제공합니다. [^2] 다른 플레이어들도 빨리지면을 얻고 있습니다. Chatgpt, Microsoft Copilot 및 PE

2022 년에 그는 사회 공학 방어 스타트 업 도플을 설립하여 바로 그렇게했습니다. 그리고 사이버 범죄자들이 공격을 터보 차지하기 위해 더욱 진보 된 AI 모델을 활용함에 따라 Doppel의 AI 시스템은 비즈니스가 더 빠르게 빠르게 그리고 더 빠르게 그리고 규모로 싸우는 데 도움이되었습니다.

Voila는 적합한 세계 모델과 상호 작용하여 생성 AI 및 LLM을 실질적으로 향상시킬 수 있습니다. 그것에 대해 이야기합시다. 혁신적인 AI 혁신에 대한이 분석은

노동당 2050 년. 전국의 공원은 전통적인 바베큐를 즐기는 가족들로 가득 차고 향수를 불러 일으키는 퍼레이드는 도시 거리를 통해 바람을 피 웁니다. 그러나 축하 행사는 이제 박물관과 같은 품질을 가지고 있습니다.


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

Atom Editor Mac 버전 다운로드
가장 인기 있는 오픈 소스 편집기

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

PhpStorm 맥 버전
최신(2018.2.1) 전문 PHP 통합 개발 도구

맨티스BT
Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.

mPDF
mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.