搜尋
首頁科技週邊人工智慧了解命中率,MRR和MMR指標

介紹

想像一下瀏覽書店以進行完美閱讀。您渴望特定於流派的建議,但希望發現新作者的多樣性。檢索增強的生成(RAG)系統的功能相似,將信息檢索與創意響應生成融為一體。評估其績效需要指標,例如命中率(衡量成功的建議)和平均相互等級(MRR,考慮建議順序)。最大邊緣相關性(MMR)確保了建議的相關性和多樣性。這些指標保證了準確,多樣化和引人入勝的建議。

概述

本指南探討了命中率,MMR及其在評估抹布系統中的作用。您將學會將MMR用於在檢索結果中平衡相關性和多樣性,計算命中率和MRR評估檢索有效性,並使用這些性能指標分析/改善抹布系統。

目錄

  • 什麼是命中率?
  • 計算命中率
  • 命中率限制
  • 平均相互等級(MRR)
  • 計算MRR
  • 最大邊緣相關性(MMR)
  • 計算MMR
  • MMR示例
  • 常見問題

什麼是命中率?

命中率通過測量所需項目在頂級建議中出現的頻率來評估建議系統性能。在抹布中,它表示成功將相關數據納入生成的輸出的頻率。

計算命中率?

命中率是通過將相關項目出現在頂級建議中的查詢數量除以查詢總數的查詢數量來計算的。數學上:

了解命中率,MRR和MMR指標

示例:三個查詢(Q1,Q2,Q3),帶有相應的目標節點(N1,N2,N3)。檢索的節點是:

了解命中率,MRR和MMR指標

Q1的命中率為1,Q3為0。所以:

了解命中率,MRR和MMR指標

命中率限制

命中率的主要限制是無視檢索到的節點的位置。考慮兩個獵犬:

了解命中率,MRR和MMR指標

兩者都具有相同的命中率(66.66%),但是Retriever 2始終將正確的節點排名更高(位置1比Q1的位置3)。這凸顯了對考慮排名的度量的需求。

平均相互等級(MRR)

平均相互等級(MRR)通過考慮排名列表中的第一個相關項目的等級來評估信息檢索系統。在RAG中,它評估了檢索組件在尋找相關文檔以進行準確響應生成時的性能。

計算MRR?

了解命中率,MRR和MMR指標

其中n是查詢的數量,而ranki是查詢i的第一個相關文檔的等級。

例子:

了解命中率,MRR和MMR指標

Q1的MRR為1/3。所以:

了解命中率,MRR和MMR指標

請注意,儘管命中率達到66.66%,但MRR為44.4%,獎勵將相關物品更高的檢索員獎勵。

最大邊緣相關性(MMR)

最大邊緣相關性(MMR)重新排列結果以優化相關性和多樣性。它可以平衡新穎性和相關性,以確保已檢索的項目全面解決查詢方面。

計算MMR?

了解命中率,MRR和MMR指標

λ(mmr_threshold)控制相關性/多樣性權衡。接近1的λ優先考慮相關性;接近0的λ優先考慮多樣性。

MMR示例

使用與HIT率相同的示例,具有相關性和相似性得分,λ= 0.5:

了解命中率,MRR和MMR指標

原始文檔中提供了Q1,Q2和Q3的詳細MMR計算和重新排列。最終重新排列的節點說明了MMR在相關性和多樣性之間達到的平衡。

結論

命中率,MRR和MMR對於評估和改善抹布系統至關重要。命中率和MRR專注於相關信息檢索頻率和排名,而MMR平衡相關性和多樣性。優化這些指標可增強抹布系統的響應質量和用戶體驗。

常見問題

Q1。什麼是命中率?答:這是最高建議中的查詢與相關項目與查詢總數的比率。

Q2。什麼是MMR?答:最大的邊際相關性是一種重新排列技術,平衡了檢索結果中的相關性和多樣性。

Q3。為什麼命中率對抹布很重要?答:更高的命中率表明更好地檢索相關信息,從而導致更準確的響應。

Q4。為什麼MMR對抹布很重要? A. MMR確保各種各樣的相關結果,為查詢提供全面的答案。

以上是了解命中率,MRR和MMR指標的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
特斯拉的Robovan是2024年的Robotaxi預告片中的隱藏寶石特斯拉的Robovan是2024年的Robotaxi預告片中的隱藏寶石Apr 22, 2025 am 11:48 AM

自2008年以來,我一直倡導這輛共享乘車麵包車,即後來被稱為“ Robotjitney”,後來是“ Vansit”,這是城市運輸的未來。 我預見這些車輛是21世紀的下一代過境解決方案Surpas

Sam俱樂部在AI上押注以消除收據檢查並增強零售Sam俱樂部在AI上押注以消除收據檢查並增強零售Apr 22, 2025 am 11:29 AM

革新結帳體驗 Sam's Club的創新性“ Just Go”系統建立在其現有的AI驅動“掃描和GO”技術的基礎上,使會員可以在購物旅行期間通過Sam's Club應用程序進行掃描。

Nvidia的AI Omniverse在GTC 2025擴展Nvidia的AI Omniverse在GTC 2025擴展Apr 22, 2025 am 11:28 AM

NVIDIA在GTC 2025上的增強可預測性和新產品陣容 NVIDIA是AI基礎架構的關鍵參與者,正在專注於提高其客戶的可預測性。 這涉及一致的產品交付,達到績效期望以及

探索Google的功能探索Google的功能Apr 22, 2025 am 11:26 AM

Google的Gemma 2:強大,高效的語言模型 Google的Gemma語言模型家族以效率和性能而慶祝,隨著Gemma 2的到來而擴展。此最新版本包括兩種模型:270億個參數VER

下一波《 Genai:與Kirk Borne博士的觀點》 -Analytics Vidhya下一波《 Genai:與Kirk Borne博士的觀點》 -Analytics VidhyaApr 22, 2025 am 11:21 AM

這一領先的數據劇集以數據科學家,天體物理學家和TEDX演講者Kirk Borne博士為特色。 Borne博士是大數據,AI和機器學習的著名專家,為當前狀態和未來的Traje提供了寶貴的見解

AI適合跑步者和運動員:我們取得了出色的進步AI適合跑步者和運動員:我們取得了出色的進步Apr 22, 2025 am 11:12 AM

這次演講中出現了一些非常有見地的觀點——關於工程學的背景信息,這些信息向我們展示了為什麼人工智能如此擅長支持人們的體育鍛煉。 我將從每位貢獻者的觀點中概括出一個核心思想,以展示三個設計方面,這些方面是我們探索人工智能在體育運動中應用的重要組成部分。 邊緣設備和原始個人數據 關於人工智能的這個想法實際上包含兩個組成部分——一個與我們放置大型語言模型的位置有關,另一個與我們人類語言和我們的生命體徵在實時測量時“表達”的語言之間的差異有關。 Alexander Amini 對跑步和網球都很了解,但他還

傑米·恩格斯特羅姆(Jamie Engstrom)關於卡特彼勒的技術,人才和轉型傑米·恩格斯特羅姆(Jamie Engstrom)關於卡特彼勒的技術,人才和轉型Apr 22, 2025 am 11:10 AM

卡特彼勒(Caterpillar)的首席信息官兼高級副總裁傑米·恩格斯特(Jamie Engstrom)領導了一支由28個國家 /地區的2200多名IT專業人員組成的全球團隊。 在卡特彼勒(Caterpillar)工作了26年,其中包括她目前的四年半,Engst

新的Google照片更新使任何具有Ultra HDR質量的照片流行新的Google照片更新使任何具有Ultra HDR質量的照片流行Apr 22, 2025 am 11:09 AM

Google Photos的新Ultra HDR工具:快速指南 使用Google Photos的新型Ultra HDR工具增強照片,將標準圖像轉換為充滿活力的高動態範圍傑作。對於社交媒體而言,此工具可提高任何照片的影響,

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能