一文讀懂分類模型評估指標-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

一文讀懂分類模型評估指標

王林

Jan 07, 2024 pm 08:45 PM

機器學習深度學習模型評估

模型評估是深度學習和機器學習中非常重要的一部分，用於衡量模型的性能和效果。本文將逐步分解混淆矩陣，準確性，精確度，回想率和F1分數

一文讀懂分類模型評估指標

混淆矩陣

#混淆矩陣用於評估模型在分類問題中的表現，它是一個展示模型對樣本分類情況的表格。行代表實際類別，列代表預測類別。對於二分類問題，混淆矩陣的結構如下所示：

一文讀懂分類模型評估指標

#True Positive (TP): 實際上為正例，模型預測為正例的樣本數，模型正確辨識正面實例的能力。較高的TP通常是可取的
False Negative (FN): 實際為正例，模型預測為負例的樣本數，根據應用程式的不同，這可能是關鍵的(例如，未能偵測到安全威脅)。
False Positive (FP): 實際上為負例，模型預測為正例的樣本數，強調模型在不應該預測為正的情況下預測為正的情況，這可能會產生取決於應用的後果(例如，醫療診斷中不必要的治療)
True Negative (TN): 實際為負例，模型預測為負例的樣本數，反映模型正確辨識否定實例的能力。通常需要更高的TN

初學者看起來很亂，但實際上這很簡單。後面的Negative/Positive是模型預測值，前面的True/False是模型預測的準確度。例如，True Negative表示模型預測為Negative且與實際值相符，即預測正確。這樣就容易理解了。以下是一個簡單的混淆矩陣：

from sklearn.metrics import confusion_matrix import seaborn as sns import matplotlib.pyplot as plt # Example predictions and true labels y_true = [1, 0, 1, 1, 0, 1, 0, 0, 1, 0] y_pred = [1, 0, 1, 0, 0, 1, 0, 1, 1, 1] # Create a confusion matrix cm = confusion_matrix(y_true, y_pred) # Visualize the blueprint sns.heatmap(cm, annot=True, fmt="d", cmap="Blues", xticklabels=["Predicted 0", "Predicted 1"], yticklabels=["Actual 0", "Actual 1"]) plt.xlabel("Predicted") plt.ylabel("Actual") plt.show()

當你想強調正確的預測和整體準確度時，使用TP和TN。當你想了解你的模型所犯的錯誤類型時，使用FP和FN。例如，在誤報成本很高的應用程式中，最小化誤報可能是至關重要的。

舉個例子，我們來談談垃圾郵件分類器。混淆矩陣可以幫助我們了解該分類器正確識別了多少封垃圾郵件，以及錯誤地將多少封非垃圾郵件標記為垃圾郵件

基於混淆矩陣，可以計算許多其他評估指標，例如準確度、精確度、召回率和F1分數。

Accuracy

一文讀懂分類模型評估指標

#根據我們上面的總結，計算的是能夠正確預測的的比例，分子是TP和TN都是True，也就是模型預測對了的總數

Precision

一文讀懂分類模型評估指標

# #可以看到公式，他計算的是Positive 的佔比，也就是說數據中所有Positive的，正確預測對了有多少，所以精確度Precision又被稱作查準率

在誤報有重大後果或成本的情況下，這一點變得非常重要。以醫學診斷模型為例，精確度的確保確保只有真正需要治療的人接受治療

#Recall

回收率，又稱為敏感度或真陽性率，是指模型捕捉到所有正類實例的能力

一文讀懂分類模型評估指標

#從公式中可以看出，它的主要目的是計算模型所捕捉的實際正例的數量，也就是正例的比例。因此，Recall又被稱為查全率

F1 Score

#F1分數的計算公式為： F1 = 2 * (精確度 * 召回率) / (精確度召回率) 其中，精確度是指模型預測為正例的樣本中，實際為正例的比例；召回率是指模型正確預測為正例的樣本數佔所有實際為正例的樣本數的比例。 F1分數是精確度和召回率的調和平均值，它能夠綜合考慮模型的準確性和全面性，以評估模型的表現

一文讀懂分類模型評估指標

# #F1分數很重要，因為它提供了精確率和召回率之間的折衷。當你想在準確率和召回率之間找到平衡時，或者說針對一般的應用可以使用F1 Score

Summary

In this article, we introduced the confusion matrix, accuracy, precision, recall and F1 score in detail, and pointed out that these indicators can effectively evaluate and Improve model performance

以上是一文讀懂分類模型評估指標的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：51CTO.COM。如有侵權，請聯絡admin@php.cn刪除

通過AI和NLG進行財務報告 - 分析VidhyaApr 15, 2025 am 10:35 AM

AI驅動的財務報告：通過自然語言產生革新見解在當今動態的業務環境中，準確及時的財務分析對於戰略決策至關重要。傳統財務報告

這款Google DeepMind機器人會在2028年奧運會上演奏嗎？Apr 15, 2025 am 10:16 AM

Google DeepMind的乒乓球機器人：體育和機器人技術的新時代巴黎2024年奧運會可能已經結束，但是由於Google DeepMind，運動和機器人技術的新時代正在興起。他們的開創性研究（“實現人類水平的競爭

使用Gemini Flash 1.5型號構建食物視覺網絡應用Apr 15, 2025 am 10:15 AM

雙子座閃光燈1.5解鎖效率和可伸縮性：燒瓶食物視覺webapp 在快速發展的AI景觀中，效率和可擴展性至關重要。開發人員越來越多地尋求高性能模型，以最大程度地減少成本和延遲

使用LlamainDex實施AI代理Apr 15, 2025 am 10:11 AM

利用LlamainDex的AI特工的力量：逐步指南想像一下，一個私人助理了解您的要求並完美地執行它們，無論是快速計算還是檢索最新的市場新聞。本文探索

將.ipynb文件轉換為PDF- Analytics Vidhya的5種方法Apr 15, 2025 am 10:06 AM

Jupyter Notebook (.ipynb) 文件廣泛用於數據分析、科學計算和交互式編碼。雖然這些 Notebook 非常適合開發和與其他數據科學家共享代碼，但有時您需要將其轉換為更普遍易讀的格式，例如 PDF。本指南將引導您逐步了解將 .ipynb 文件轉換為 PDF 的各種方法，以及技巧、最佳實踐和故障排除建議。目錄為什麼將 .ipynb 轉換為 PDF？將 .ipynb 文件轉換為 PDF 的方法使用 Jupyter Notebook UI 使用 nbconve