찾다
기술 주변기기일체 포함적중률, MRR 및 MMR 메트릭 이해

소개

완벽한 읽기를 위해 서점을 탐색한다고 상상해보십시오. 당신은 장르에 따른 권장 사항을 간절히 원하지만 새로운 작가를 발견하려는 다양성을 원합니다. RAG (Resprieved-Augmented Generation) 시스템은 유사하게 기능하여 정보 검색과 창의적 응답 생성과 혼합됩니다. 성능을 평가하려면 적중률 (성공적인 권장 사항 측정) 및 평균 상호 순위 (MRR, 권장 사항 순서를 고려한 MRR)와 같은 지표가 필요합니다. 최대 한계 관련성 (MMR)은 제안의 관련성과 다양성을 보장합니다. 이 메트릭은 정확하고 다양하며 매력적인 권장 사항을 보장합니다.

개요

이 안내서는 히트율, MMR 및 RAG 시스템 평가에서의 역할을 탐구합니다. 검색된 결과의 관련성과 다양성의 균형을 맞추기 위해 MMR을 적용하고, 검색 효과를 평가하기 위해 적중률 및 MRR을 계산하며, 이러한 성능 메트릭을 사용하여 RAG 시스템을 분석/개선하는 법을 배웁니다.

목차

  • 적중률은 얼마입니까?
  • 적중률을 계산합니다
  • 적중률 제한
  • 평균 상호 순위 (MRR)
  • MRR 계산
  • 최대 한계 관련성 (MMR)
  • MMR 계산
  • MMR 예
  • 자주 묻는 질문

적중률은 얼마입니까?

적중률은 원하는 항목이 최상위 N 권장 사항 내에 얼마나 자주 나타나는지를 측정하여 추천 시스템 성능을 평가합니다. Rag에서는 관련 데이터를 생성 된 출력에 성공적으로 통합하는 빈도를 나타냅니다.

적중률 계산?

적중률은 관련 항목이 Top-N 권장 사항에 나타나는 쿼리 수를 총 쿼리 수로 나누어 계산됩니다. 수학적 :

적중률, MRR 및 MMR 메트릭 이해

예 : 해당 대상 노드 (N1, N2, N3)가있는 3 개의 쿼리 (Q1, Q2, Q3). 검색된 노드는 다음과 같습니다.

적중률, MRR 및 MMR 메트릭 이해

적중률은 Q1의 경우 1, Q2, Q3의 경우 0입니다. 그러므로:

적중률, MRR 및 MMR 메트릭 이해

적중률 제한

적중률의 주요 제한은 검색된 노드의 위치에 대한 무시입니다. 두 개의 리트리버를 고려하십시오.

적중률, MRR 및 MMR 메트릭 이해

둘 다 동일한 적중률 (66.66%)을 가지지 만 리트리버 2는 일관되게 올바른 노드를 높이 평가합니다 (Q1의 위치 1 대 위치 3). 이것은 순위를 고려하는 메트릭의 필요성을 강조합니다.

평균 상호 순위 (MRR)

평균 상호 순위 (MRR)는 순위 목록에서 첫 번째 관련 항목의 순위를 고려하여 정보 검색 시스템을 평가합니다. Rag에서는 정확한 응답 생성을위한 관련 문서를 찾는 데있어 검색 구성 요소의 성능을 평가합니다.

MRR 계산?

적중률, MRR 및 MMR 메트릭 이해

여기서 n은 쿼리 수이고 랭키는 쿼리 i의 첫 번째 관련 문서의 순위입니다.

예:

적중률, MRR 및 MMR 메트릭 이해

Q1의 MRR은 1/3입니다. 그러므로:

적중률, MRR 및 MMR 메트릭 이해

66.66%의 적중률에도 불구하고 MRR은 44.4%로 관련 항목을 더 높은 리트리버로 보상합니다.

최대 한계 관련성 (MMR)

최대 한계 관련성 (MMR) 리 평가는 관련성과 다양성을 모두 최적화합니다. 검색된 항목이 종합적으로 쿼리 측면을 해결하기 위해 참신과 관련성의 균형을 유지합니다.

MMR 계산?

적중률, MRR 및 MMR 메트릭 이해

λ (mmr_threshold)는 관련성/다양성 트레이드 오프를 제어합니다. λ에 가까운 λ는 관련성을 우선시합니다. λ에 가까운 λ는 다양성을 우선시합니다.

MMR 예

적중률과 동일한 예제를 사용하고 관련성 및 유사성 점수가 가정하고 λ = 0.5 :

적중률, MRR 및 MMR 메트릭 이해

Q1, Q2 및 Q3의 상세한 MMR 계산 및 재평가는 원본 문서에 제공됩니다. 최종 재 순위 노드는 MMR이 관련성과 다양성 사이의 균형을 보여줍니다.

결론

적중률, MRR 및 MMR은 RAG 시스템을 평가하고 개선하는 데 중요합니다. 적중률과 MRR은 관련 정보 검색 빈도 및 순위에 중점을두고 MMR은 관련성과 다양성의 균형을 유지합니다. 이러한 메트릭을 최적화하면 RAG 시스템 응답 품질 및 사용자 경험이 향상됩니다.

자주 묻는 질문

Q1. 적중률은 얼마입니까? A. 상단 N 권장 사항에 관련 항목이있는 쿼리 비율은 총 쿼리 수입니다.

Q2. MMR이란 무엇입니까? A. 최대 한계 관련성은 검색된 결과의 균형과 관련성과 다양성의 재 순위 기술입니다.

Q3. RAG에 적중률이 중요한 이유는 무엇입니까? A. 적중률이 높을수록 관련 정보가 더 나은 검색을 의미하여보다 정확한 응답으로 이어집니다.

Q4. MMR이 헝겊에 중요한 이유는 무엇입니까? A. MMR은 다양한 결과를 보장하여 쿼리에 대한 포괄적 인 답변을 제공합니다.

위 내용은 적중률, MRR 및 MMR 메트릭 이해의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
Tesla의 Robovan은 2024 년 Robotaxi 티저의 숨겨진 보석이었습니다.Tesla의 Robovan은 2024 년 Robotaxi 티저의 숨겨진 보석이었습니다.Apr 22, 2025 am 11:48 AM

2008 년 이래로 저는 도시 교통의 미래로서 "Robotjitney"라고 불리는 공유 라이드 밴을 옹호했습니다. 나는이 차량들을 21 세기의 차세대 대중 교통 솔루션 인 Surpas로 예측합니다.

Sam 's Club은 영수증 수표를 제거하고 소매를 강화하기 위해 AI에 베팅합니다.Sam 's Club은 영수증 수표를 제거하고 소매를 강화하기 위해 AI에 베팅합니다.Apr 22, 2025 am 11:29 AM

체크 아웃 경험 혁명 Sam 's Club의 혁신적인 "Just Go"시스템은 기존 AI 기반 AI 기반 "Scan & Go"기술을 기반으로하여 회원이 쇼핑 중에 Sam's Club 앱을 통해 구매를 스캔 할 수 있습니다.

Nvidia의 AI Omniverse는 GTC 2025에서 확장됩니다Nvidia의 AI Omniverse는 GTC 2025에서 확장됩니다Apr 22, 2025 am 11:28 AM

GTC 2025에서 Nvidia의 향상된 예측 가능성 및 신제품 라인업 AI 인프라의 핵심 업체 인 Nvidia는 고객의 예측 가능성 증가에 중점을두고 있습니다. 여기에는 일관된 제품 제공, 성과 기대치 충족 및 충족이 포함됩니다

Google의 Gemma 2 모델의 기능을 탐색합니다Google의 Gemma 2 모델의 기능을 탐색합니다Apr 22, 2025 am 11:26 AM

Google의 Gemma 2 : 강력하고 효율적인 언어 모델 효율성과 성능으로 축하되는 Google의 Gemma Family of Language 모델은 Gemma 2의 도착으로 확장되었습니다.이 최신 릴리스는 두 가지 모델로 구성됩니다 : 27 억 매개 변수 Ver Ver

Genai의 다음 물결 : Kirk Borne 박사와의 관점 -Salystics VidhyaGenai의 다음 물결 : Kirk Borne 박사와의 관점 -Salystics VidhyaApr 22, 2025 am 11:21 AM

이 데이터 에피소드와 함께이 선도에는 주요 데이터 과학자, 천체 물리학 자, TEDX 스피커 인 Kirk Borne 박사가 있습니다. Borne 박사는 빅 데이터, AI 및 머신 러닝 분야의 유명한 전문가 인 현재 상태와 미래의 Traje에 대한 귀중한 통찰력을 제공합니다.

주자와 운동 선수를위한 AI : 우리는 훌륭한 진전을 이루고 있습니다주자와 운동 선수를위한 AI : 우리는 훌륭한 진전을 이루고 있습니다Apr 22, 2025 am 11:12 AM

이 연설에는 인공 지능이 사람들의 신체 운동을 지원하는 데 왜 좋은지를 보여주는 공학에 대한 백 그라운드 정보가 매우 통찰력있는 관점이있었습니다. 스포츠에서 인공 지능 적용을 탐구하는 데 중요한 부분 인 세 가지 디자인 측면을 보여주기 위해 각 기고자의 관점에서 핵심 아이디어를 간략하게 설명 할 것입니다. 에지 장치 및 원시 개인 데이터 인공 지능에 대한이 아이디어에는 실제로 두 가지 구성 요소가 포함되어 있습니다. 하나는 우리가 큰 언어 모델을 배치하는 위치와 관련하여 하나의 구성 요소와 다른 하나는 인간 언어와 활력 징후가 실시간으로 측정 될 때“표현”하는 언어의 차이와 관련이 있습니다. Alexander Amini는 달리기와 테니스에 대해 많은 것을 알고 있지만 그는 여전히

Caterpillar의 기술, 인재 및 혁신에 관한 Jamie EngstromCaterpillar의 기술, 인재 및 혁신에 관한 Jamie EngstromApr 22, 2025 am 11:10 AM

Caterpillar의 최고 정보 책임자이자 IT의 수석 부사장 인 Jamie Engstrom은 28 개국에서 2,200 명 이상의 IT 전문가로 구성된 글로벌 팀을 이끌고 있습니다. 현재 역할에서 4 년 반을 포함하여 Caterpillar에서 26 년 동안 Engst

새로운 Google 사진 업데이트는 Ultra HDR 품질로 모든 사진 팝을 만듭니다.새로운 Google 사진 업데이트는 Ultra HDR 품질로 모든 사진 팝을 만듭니다.Apr 22, 2025 am 11:09 AM

Google Photos의 새로운 Ultra HDR 도구 : 빠른 가이드 Google Photos의 새로운 Ultra HDR 도구로 사진을 향상시켜 표준 이미지를 활기차고 높은 동기 범위의 걸작으로 변환하십시오. 소셜 미디어에 이상적 이며이 도구는 모든 사진의 영향을 높이고

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

mPDF

mPDF

mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.

SublimeText3 영어 버전

SublimeText3 영어 버전

권장 사항: Win 버전, 코드 프롬프트 지원!

WebStorm Mac 버전

WebStorm Mac 버전

유용한 JavaScript 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

SublimeText3 Linux 새 버전

SublimeText3 Linux 새 버전

SublimeText3 Linux 최신 버전