導入
完璧な読み物のために書店を閲覧することを想像してみてください。あなたはジャンル固有の推奨事項を切望していますが、新しい著者を発見するために多様性を望んでいます。検索された生成(RAG)システムも同様に機能し、情報検索と創造的な応答生成をブレンドします。パフォーマンスを評価するには、ヒット率(成功した推奨事項の測定)や平均相互ランク(MRR、推奨順序を考慮)などのメトリックが必要です。最大限界関連性(MMR)は、提案における関連性と多様性の両方を保証します。これらのメトリックは、正確で多様で魅力的な推奨事項を保証します。
概要
このガイドでは、ヒット率、MMR、およびRAGシステムの評価における役割を調査します。検索結果の関連性と多様性のバランスをとるためにMMRを適用し、検索の有効性を評価するためにヒット率とMRRを計算し、これらのパフォーマンスメトリックを使用してRAGシステムを分析/改善することを学びます。
目次
- ヒット率とは?
- ヒット率の計算
- ヒット率の制限
- 平均相互ランク(MRR)
- MRRの計算
- 最大限界関連性(MMR)
- MMRの計算
- MMRの例
- よくある質問
ヒット率とは?
HITレートは、TOP-Nの推奨事項内に目的のアイテムが表示される頻度を測定することにより、推奨システムのパフォーマンスを評価します。 RAGでは、生成された出力に関連するデータを正常に組み込む頻度を意味します。
ヒット率の計算?
ヒット率は、関連するアイテムがTOP-Nの推奨事項に表示されるクエリの総数で表示されるクエリの数を割ることによって計算されます。数学的に:
例:対応するターゲットノード(N1、N2、N3)を備えた3つのクエリ(Q1、Q2、Q3)。取得したノードは次のとおりです。
ヒット率はQ1の場合は1、Q2は0、Q3で0です。したがって:
ヒット率の制限
ヒット率の主な制限は、取得したノードの位置を無視することです。 2つのレトリバーを検討してください。
どちらも同じヒット率(66.66%)を持っていますが、Retriver 2は一貫して正しいノードを高くランク付けします(Q1の位置1対位置3)。これは、ランキングを考慮するメトリックの必要性を強調しています。
平均相互ランク(MRR)
平均相互ランク(MRR)は、ランク付けされたリストの最初の関連アイテムのランクを考慮することにより、情報検索システムを評価します。 RAGでは、正確な応答生成のために関連するドキュメントを見つける際の検索コンポーネントのパフォーマンスを評価します。
MRRを計算しますか?
ここで、nはクエリの数であり、rankiはクエリiの最初の関連ドキュメントのランクです。
例:
Q1のMRRは1/3です。したがって:
66.66%のヒット率にもかかわらず、MRRは44.4%であり、関連するアイテムをより高く配置するレトリーバーに報いることに注意してください。
最大限界関連性(MMR)
最大限界関連性(MMR)は、関連性と多様性の両方を最適化するために結果を再ランクします。検索されたアイテムがクエリの側面に包括的に対処することを保証するために、斬新さと関連性のバランスを取ります。
MMRを計算しますか?
λ(mmr_threshold)は、関連性/多様性のトレードオフを制御します。 1に近いλ関連性を優先します。 0に近いλは、多様性に優先順位を付けます。
MMRの例
想定された関連性と類似性スコアを伴うヒット率と同じ例を使用し、λ= 0.5:
Q1、Q2、およびQ3の詳細なMMR計算と再ランキングは、元のドキュメントに記載されています。最終的な再ランクノードは、MMRが関連性と多様性の間で達成するバランスを示しています。
結論
ヒット率、MRR、およびMMRは、RAGシステムを評価および改善するために重要です。 HITレートとMRRは、関連する情報の検索頻度とランキングに焦点を当て、MMRは関連性と多様性のバランスをとります。これらのメトリックを最適化すると、RAGシステムの応答の品質とユーザーエクスペリエンスが向上します。
よくある質問
Q1。ヒット率とは? A.これは、クエリの総数に対するTOP-Nの推奨事項に関連するアイテムを持つクエリの比率です。
Q2。 MMRとは何ですか? A.最大の限界関連性は、検索された結果の関連性と多様性のバランスをとる再ランキング手法です。
Q3。 RAGにとってヒット率が重要なのはなぜですか? A.ヒット率が高いほど、関連情報の検索が改善され、より正確な応答が発生します。
Q4。なぜMMRはRAGにとって重要なのですか? A. MMRは、多様で関連する結果を保証し、クエリに対する包括的な回答を提供します。
以上がヒット率、MRR、およびMMRメトリックを理解していますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ChatGptはアクセスできませんか?この記事では、さまざまな実用的なソリューションを提供しています!多くのユーザーは、ChatGPTを毎日使用する場合、アクセス不能や応答が遅いなどの問題に遭遇する可能性があります。この記事では、さまざまな状況に基づいてこれらの問題を段階的に解決するように導きます。 ChatGPTのアクセス不能性と予備的なトラブルシューティングの原因 まず、問題がOpenaiサーバー側にあるのか、ユーザー自身のネットワークまたはデバイスの問題にあるのかを判断する必要があります。 以下の手順に従って、トラブルシューティングしてください。 ステップ1:OpenAIの公式ステータスを確認してください OpenAIステータスページ(status.openai.com)にアクセスして、ChatGPTサービスが正常に実行されているかどうかを確認してください。赤または黄色のアラームが表示されている場合、それは開くことを意味します

2025年5月10日、MIT物理学者のMax Tegmarkは、AI Labsが人工的なスーパーインテリジェンスを解放する前にOppenheimerの三位一体計算をエミュレートすべきだとGuardianに語った。 「私の評価では、「コンプトン定数」、競争が

AI Music Creation Technologyは、1日ごとに変化しています。この記事では、ChatGPTなどのAIモデルを例として使用して、AIを使用して音楽の作成を支援し、実際のケースで説明する方法を詳細に説明します。 Sunoai、Hugging Face、PythonのMusic21 Libraryを通じて音楽を作成する方法を紹介します。 これらのテクノロジーを使用すると、誰もがオリジナルの音楽を簡単に作成できます。ただし、AIに生成されたコンテンツの著作権問題は無視できないことに注意する必要があります。使用する際には注意する必要があります。 音楽分野でのAIの無限の可能性を一緒に探りましょう! Openaiの最新のAIエージェント「Openai Deep Research」が紹介します。 [chatgpt] ope

ChATGPT-4の出現により、AIアプリケーションの可能性が大幅に拡大しました。 GPT-3.5と比較して、CHATGPT-4は大幅に改善されました。強力なコンテキスト理解能力を備えており、画像を認識して生成することもできます。普遍的なAIアシスタントです。それは、ビジネス効率の改善や創造の支援など、多くの分野で大きな可能性を示しています。ただし、同時に、その使用における予防策にも注意を払わなければなりません。 この記事では、ChATGPT-4の特性を詳細に説明し、さまざまなシナリオの効果的な使用方法を紹介します。この記事には、最新のAIテクノロジーを最大限に活用するためのスキルが含まれています。参照してください。 Openaiの最新のAIエージェント、「Openai Deep Research」の詳細については、以下のリンクをクリックしてください

ChatGPTアプリ:AIアシスタントで創造性を解き放つ!初心者向けガイド ChatGPTアプリは、文章作成、翻訳、質問応答など、多様なタスクに対応する革新的なAIアシスタントです。創作活動や情報収集にも役立つ、無限の可能性を秘めたツールです。 この記事では、ChatGPTスマホアプリのインストール方法から、音声入力機能やプラグインといったアプリならではの機能、そしてアプリ利用上の注意点まで、初心者にも分かりやすく解説します。プラグインの制限やデバイス間の設定同期についてもしっかりと触れていきま

Chatgpt中国語版:中国語のAIの対話の新しい体験のロックを解除する ChatGptは世界中で人気がありますが、中国語版も提供していることをご存知ですか?この強力なAIツールは、毎日の会話をサポートするだけでなく、プロのコンテンツを処理し、簡素化された伝統的な中国語と互換性があります。中国のユーザーであろうと、中国語を学んでいる友人であろうと、あなたはそれから利益を得ることができます。 この記事では、アカウント設定、中国語の迅速な単語入力、フィルターの使用、さまざまなパッケージの選択を含むChatGpt中国語のバージョンの使用方法を詳細に紹介し、潜在的なリスクと対応戦略を分析します。さらに、ChatGpt中国語版を他の中国のAIツールと比較して、その利点とアプリケーションシナリオをよりよく理解するのに役立ちます。 Openaiの最新のAIインテリジェンス

これらは、生成AIの分野で次の飛躍と考えることができ、ChatGptやその他の大規模なモデルのチャットボットを提供しました。単に質問に答えたり情報を生成したりするのではなく、彼らは私たちに代わって行動を起こすことができます。

ChatGPTを活用した効率的な複数アカウント管理術|ビジネスとプライベートの使い分けも徹底解説! 様々な場面で活用されているChatGPTですが、複数アカウントの管理に頭を悩ませている方もいるのではないでしょうか。この記事では、ChatGPTの複数アカウント作成方法、利用上の注意点、そして安全かつ効率的な運用方法を詳しく解説します。ビジネス利用とプライベート利用の使い分け、OpenAIの利用規約遵守といった重要な点にも触れ、複数アカウントを安全に活用するためのガイドを提供します。 OpenAI


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

MinGW - Minimalist GNU for Windows
このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

Safe Exam Browser
Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。

DVWA
Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、

Dreamweaver Mac版
ビジュアル Web 開発ツール

EditPlus 中国語クラック版
サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません
