suchen
HeimTechnologie-PeripheriegeräteKIVerständnis der Metriken der Trefferquote, MRR und MMR

Einführung

Stellen Sie sich vor, Sie stöbern in einem Buchladen für die perfekte Lektüre. Sie sehnen sich nach genrespezifischen Empfehlungen und wünschen sich jedoch Abwechslung, neue Autoren zu entdecken. Die Systeme (retrieval-augmented Generation) funktionieren in ähnlicher Weise und verbinden Informationen zum Abrufen der kreativen Reaktion. Die Bewertung ihrer Leistung erfordert Metriken wie Hit -Rate (Messung erfolgreicher Empfehlungen) und mittlerer gegenseitiger Rang (MRR, Berücksichtigung der Empfehlungsreihenfolge). Die maximale marginale Relevanz (MMR) gewährleistet sowohl die Relevanz als auch die Vielfalt der Vorschläge. Diese Metriken garantieren genaue, abwechslungsreiche und ansprechende Empfehlungen.

Überblick

Dieser Leitfaden untersucht die Trefferquote, MMR und ihre Rolle bei der Bewertung von Lappensystemen. Sie lernen, MMR für die Ausgleich von Relevanz und Vielfalt in abgerufenen Ergebnissen, die Trefferquote und die MRR für die Bewertung der Effektivität des Abrufs zu berechnen und Lag -Systeme mithilfe dieser Leistungsmetriken zu analysieren/zu verbessern.

Inhaltsverzeichnis

  • Was ist Trefferquote?
  • Berechnung der Trefferrate
  • Trefferzinsbeschränkungen
  • Mittlerer wechselseitiger Rang (MRR)
  • Berechnung von MRR
  • Maximale Relevanz der marginalen Relevanz (MMR)
  • Berechnung von MMR
  • MMR -Beispiel
  • Häufig gestellte Fragen

Was ist Trefferquote?

Trefferquote bewertet die Leistung des Empfehlungssystems, indem er misst, wie oft das gewünschte Element innerhalb der Top-N-Empfehlungen erscheint. In RAG bedeutet es die Häufigkeit, relevante Daten erfolgreich in die generierte Ausgabe einzubeziehen.

Berechnung der Hitrate?

Die Trefferquote wird berechnet, indem die Anzahl der Abfragen geteilt wird, bei denen der entsprechende Element in den Top-N-Empfehlungen durch die Gesamtzahl der Abfragen angezeigt wird. Mathematisch:

Verständnis der Metriken der Trefferquote, MRR und MMR

Beispiel: Drei Abfragen (Q1, Q2, Q3) mit entsprechenden Zielknoten (N1, N2, N3). Abgerufene Knoten sind:

Verständnis der Metriken der Trefferquote, MRR und MMR

Die Trefferquote ist 1 für Q1 und Q2, 0 für Q3. Daher:

Verständnis der Metriken der Trefferquote, MRR und MMR

Trefferzinsbeschränkungen

Die Hauptbeschränkung der Trefferquote ist die Missachtung der Position des abgerufenen Knotens. Betrachten Sie zwei Retriever:

Verständnis der Metriken der Trefferquote, MRR und MMR

Beide haben die gleiche Trefferquote (66,66%), aber Retriever 2 rangiert konsequent korrekte Knoten höher (Position 1 gegen Position 3 für Q1). Dies unterstreicht die Notwendigkeit einer Metrik, die das Ranking berücksichtigt.

Mittlerer wechselseitiger Rang (MRR)

Der mittlere wechselseitige Rang (MRR) bewertet Informationen zum Abrufen von Information, indem der Rang des ersten relevanten Elements in einer Rangliste berücksichtigt wird. In RAG bewertet es die Leistung der Abrufkomponente bei der Suche nach relevanten Dokumenten für eine genaue Antwortgenerierung.

Berechnung von MRR?

Verständnis der Metriken der Trefferquote, MRR und MMR

Wobei n die Anzahl der Abfragen ist und Ranki der Rang des ersten relevanten Dokuments für die Abfrage i ist.

Beispiel:

Verständnis der Metriken der Trefferquote, MRR und MMR

MRR für Q1 ist 1/3. Daher:

Verständnis der Metriken der Trefferquote, MRR und MMR

Beachten Sie, dass MRR trotz einer Trefferquote von 66,66% 44,4% beträgt, was Retriever belohnt, die relevante Gegenstände höher platzieren.

Maximale Relevanz der marginalen Relevanz (MMR)

Die maximale marginale Relevanz (MMR) wird die Ergebnisse erneut ausgerichtet, um sowohl die Relevanz als auch die Vielfalt zu optimieren. Es gleicht Neuheit und Relevanz aus, um sicherzustellen, dass abgerufene Elemente umfassende Abfrageaspekte behandeln.

Berechnung von MMR?

Verständnis der Metriken der Trefferquote, MRR und MMR

λ (mmr_threshold) steuert den Kompromiss der Relevanz/Vielfalt. λ nahe 1 priorisiert die Relevanz; λ nahe 0 priorisiert die Vielfalt.

MMR -Beispiel

Verwenden Sie das gleiche Beispiel wie die Trefferquote mit angenommenen Relevanz- und Ähnlichkeitswerten und λ = 0,5:

Verständnis der Metriken der Trefferquote, MRR und MMR

Die detaillierte MMR-Berechnung und -Ranking für Q1, Q2 und Q3 finden Sie im Originaldokument. Die endgültigen neu gewonnenen Knoten veranschaulichen das Gleichgewicht, das MMR zwischen Relevanz und Vielfalt erreicht.

Abschluss

Trefferquote, MRR und MMR sind entscheidend für die Bewertung und Verbesserung von Lappensystemen. Trefferquote und MRR konzentrieren sich auf relevante Informationsabruffrequenz und Ranking, während MMR die Relevanz und Vielfalt ausgleichen. Die Optimierung dieser Metriken verbessert die Qualität und die Benutzererfahrung von Lappensystemen.

Häufig gestellte Fragen

Q1. Was ist Trefferquote? A. Es ist das Verhältnis von Abfragen mit relevanten Elementen in den Top-N-Empfehlungen zur Gesamtzahl der Abfragen.

Q2. Was ist MMR? A. Die maximale marginale Relevanz ist eine Relevanz und Vielfalt der Wiederholungstechnik in abgerufenen Ergebnissen.

Q3. Warum ist Trefferrate für RAG wichtig? A. Eine höhere Trefferquote zeigt ein besseres Abrufen relevanter Informationen an, was zu genaueren Antworten führt.

Q4. Warum ist MMR für RAG wichtig? A. MMR sorgt für vielfältige und relevante Ergebnisse und liefert umfassende Antworten auf Fragen.

Das obige ist der detaillierte Inhalt vonVerständnis der Metriken der Trefferquote, MRR und MMR. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Bewertung der Toxizität in großen SprachmodellenBewertung der Toxizität in großen SprachmodellenApr 24, 2025 am 10:14 AM

In diesem Artikel wird das entscheidende Problem der Toxizität in Großsprachenmodellen (LLMs) und die Methoden zur Bewertung und Minderung von Methoden untersucht. LLMs, die verschiedene Anwendungen von Chatbots bis hin zur Erzeugung von Inhalten betreiben, erfordert robuste Bewertungsmetriken, Witz

Umfassende Anleitung zum Reranker für LappenUmfassende Anleitung zum Reranker für LappenApr 24, 2025 am 10:10 AM

RAG -Systeme (Abrufener Augmented Generation) transformieren den Zugang zum Informationen, ihre Effektivität hängt jedoch von der Qualität der abgerufenen Daten ab. Hier werden die Reranker entscheidend - als Qualitätsfilter für Suchergebnisse, um nur sicherzustellen, dass sie nur sicherstellen

Wie baue ich multimodaler Lappen mit Gemma 3 & Docling?Wie baue ich multimodaler Lappen mit Gemma 3 & Docling?Apr 24, 2025 am 10:04 AM

Dieses Tutorial führt Sie durch den Aufbau einer anspruchsvollen multimodalen Abrufpipeline (RAGMent-Generation) in Google Colab. Wir werden modernste Tools wie Gemma 3 (für Sprache und Vision), Docling (Dokumentkonvertierung), Langchain verwenden

Leitfaden zum Ray für skalierbare KI und maschinelles LernenanwendungenLeitfaden zum Ray für skalierbare KI und maschinelles LernenanwendungenApr 24, 2025 am 10:01 AM

Ray: Ein leistungsstarker Rahmen für die Skalierung von AI- und Python -Anwendungen Ray ist ein revolutionäres Open-Source-Framework, das mühelos AI- und Python-Anwendungen skalieren soll. Die intuitive API ermöglicht es Forschern und Entwicklern, ihren Code für zu wechseln

Wie benutze ich die OpenAI MCP -Integration für Bauagenten?Wie benutze ich die OpenAI MCP -Integration für Bauagenten?Apr 24, 2025 am 09:58 AM

OpenAI umfasst die Interoperabilität, indem es das Modellkontextprotokoll (MCP) von Anthropic unterstützt, einer Open-Source-Standard-Simpliking-Assistant-Integration der AI-Assistenten in verschiedene Datensysteme. Diese Zusammenarbeit fördert einen einheitlichen Rahmen für KI -Anwendungen nach EFF

Cache-Augmented-Generation (CAG): Ist es besser als Rag?Cache-Augmented-Generation (CAG): Ist es besser als Rag?Apr 24, 2025 am 09:54 AM

Cache-Augmented-Generation (CAG): Eine schnellere, effizientere Alternative zu Lappen Die Abruf Generation (RAG) hat die KI revolutioniert, indem er externes Wissen dynamisch einbezogen hat. Das Vertrauen in externe Quellen führt jedoch eine Latenz und führt zu

Rouge: Dekodierung der Qualität des maschinengenerierten TextesRouge: Dekodierung der Qualität des maschinengenerierten TextesApr 24, 2025 am 09:49 AM

Bewertung großer Sprachmodelle: Ein tiefes Eintauchen in Rouge -Metriken Stellen Sie sich eine KI vor, die Gedichte komponieren, juristische Dokumente verfassen oder komplexe Forschung zusammenfasst. Wie bewerten wir ihre Leistung objektiv? Als Großsprachenmodelle (LLMs) Inc.

Verwendung von MCP: Modellkontextprotokoll - Analytics VidhyaVerwendung von MCP: Modellkontextprotokoll - Analytics VidhyaApr 24, 2025 am 09:48 AM

Schalte die Kraft der realen Daten für deine AI-Assistenten mit dem Modellkontextprotokoll (MCP) frei! Sie haben wahrscheinlich Anwendungen mit LLMs erstellt, mit Wirkstoffen experimentiert und möglicherweise sogar Langchain, Autogen oder OpenAs Assistants API verwendet. Beeindruckend a

See all articles

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

Video Face Swap

Video Face Swap

Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heiße Werkzeuge

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

SublimeText3 Englische Version

SublimeText3 Englische Version

Empfohlen: Win-Version, unterstützt Code-Eingabeaufforderungen!

SublimeText3 Linux neue Version

SublimeText3 Linux neue Version

SublimeText3 Linux neueste Version

WebStorm-Mac-Version

WebStorm-Mac-Version

Nützliche JavaScript-Entwicklungstools

mPDF

mPDF

mPDF ist eine PHP-Bibliothek, die PDF-Dateien aus UTF-8-codiertem HTML generieren kann. Der ursprüngliche Autor, Ian Back, hat mPDF geschrieben, um PDF-Dateien „on the fly“ von seiner Website auszugeben und verschiedene Sprachen zu verarbeiten. Es ist langsamer und erzeugt bei der Verwendung von Unicode-Schriftarten größere Dateien als Originalskripte wie HTML2FPDF, unterstützt aber CSS-Stile usw. und verfügt über viele Verbesserungen. Unterstützt fast alle Sprachen, einschließlich RTL (Arabisch und Hebräisch) und CJK (Chinesisch, Japanisch und Koreanisch). Unterstützt verschachtelte Elemente auf Blockebene (wie P, DIV),