Python 모델 성능 ROC 및 AUC 란 무엇입니까?-파이썬 튜토리얼-php.cn

집

백엔드 개발

파이썬 튜토리얼

Python 모델 성능 ROC 및 AUC 란 무엇입니까?

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 13, 2023 pm 02:31 PM

pythonrocauc

Text

ROC 분석 및 AUC(곡선 아래 면적)는 데이터 과학에서 널리 사용되는 도구로, 신호 처리에서 차용하여 다양한 매개변수화에서 모델의 품질을 평가하거나 둘 또는 성능을 비교합니다. 여러 모델 중. ROC 分析和曲线下面积 (AUC) 是数据科学中广泛使用的工具，借鉴了信号处理，用于评估不同参数化下模型的质量，或比较两个或多个模型的性能。

传统的性能指标，如准确率和召回率，在很大程度上依赖于正样本的观察。因此，ROC 和 AUC 使用真阳性率和假阳性率来评估质量，同时考虑到正面和负面观察结果。

从分解问题到使用机器学习解决问题的过程有多个步骤。它涉及数据收集、清理和特征工程、构建模型，最后是，评估模型性能。

当您评估模型的质量时，通常会使用精度和召回率等指标，也分别称为数据挖掘领域的置信度和灵敏度。

这些指标将预测值与通常来自保留集的实际观察值进行比较，使用混淆矩阵进行可视化。

Python 모델 성능 ROC 및 AUC 란 무엇입니까?

让我们首先关注精度，也称为阳性预测值。使用混淆矩阵，您可以将 Precision 构建为所有真实阳性与所有预测阳性的比率。

Python 모델 성능 ROC 및 AUC 란 무엇입니까?

召回率，也称为真阳性率，表示真阳性与观察到的和预测的所有阳性的比率。

Python 모델 성능 ROC 및 AUC 란 무엇입니까?

使用混淆矩阵中的不同观察集来描述 Precision 和 Recall

정밀도 및 재현율과 같은 기존 성능 지표는 양성 샘플 관찰에 크게 의존합니다. 따라서 ROC와 AUC는 긍정적인 관찰과 부정적인 관찰을 모두 고려하여 참양성률과 위양성률을 사용하여 품질을 평가합니다.

문제 분해부터 기계 학습을 사용한 해결까지 여러 단계가 있습니다. 여기에는 데이터 수집, 정리 및 기능 엔지니어링, 모델 구축, 마지막으로 모델 성능 평가가 포함됩니다.

모델의 품질을 평가할 때 일반적으로 데이터 마이닝 분야에서는 각각 신뢰도 및 민감도라고도 알려진 정밀도 및 재현율과 같은 측정항목을 사용합니다.

이 측정항목은 예측 값을 혼동 행렬을 사용하여 시각화한 홀드아웃 세트의 실제 관측값과 비교합니다.

Python 모델 성능 ROC 및 AUC 란 무엇입니까? 먼저 살펴보겠습니다 긍정적인 예측 가치라고도 알려진 정확성에 중점을 둡니다. 혼동 행렬을 사용하면 모든 예측 긍정에 대한 모든 참 긍정의 비율로 정밀도를 구성할 수 있습니다.

파이썬 모델 성능 ROC 및 AUC는 무엇입니까

재현율, 참양성률이라고도 하며, 관찰 및 예측된 모든 양성에 대한 참양성의 비율을 나타냅니다.

혼동 행렬 사용 정밀도 및 재현율의 다양한 관찰 세트를 사용하면 이러한 측정항목이 모델 성능에 대한 보기를 제공하는 방식을 이해할 수 있습니다.

정밀도와 재현율은 부정적인 예를 고려하지 않고 긍정적인 예와 예측에만 초점을 맞춘다는 점에 주목할 가치가 있습니다. 또한 모델의 성능을 단지 무작위 추측인 중앙값 시나리오와 비교하지 않습니다.

1. ROC 곡선

ROC는 정밀도와 재현율 간의 균형을 시각화하는 요약 도구 역할을 합니다. ROC 분석은 ROC 곡선을 사용하여 이진 신호 값이 노이즈, 즉 무작위성으로 오염된 정도를 확인합니다. 이는 다양한 작동 지점에 대한 연속 예측 변수의 민감도와 특이성에 대한 요약을 제공합니다. ROC 곡선은 y축의 참양성률에 대해 x축의 거짓양성률을 플롯하여 얻습니다. Python 모델 성능 ROC 및 AUC 란 무엇입니까?

진양성률은 신호를 감지할 확률이고 위양성률은 위양성률이므로 ROC 분석은 질병이나 기타 행동을 안정적으로 감지하는 임계값을 결정하기 위해 의학 연구에서도 널리 사용됩니다. 🎜🎜🎜🎜🎜완벽한 모델은 위양성률과 참양성률이 1이므로 ROC 플롯의 왼쪽 상단에 있는 단일 작동 점이 됩니다. 그리고 가능한 최악의 모델은 ROC 플롯의 왼쪽 하단에 거짓 긍정 비율이 1이고 참 긍정 비율이 0인 단일 작동 지점을 갖습니다. 🎜🎜무작위 추측 모델은 결과를 정확하게 예측할 확률이 50%이므로 거짓양성률은 항상 참양성률과 동일합니다. 이것이 그래프에 대각선이 있는 이유입니다. 이는 신호 대 잡음을 감지할 확률이 50/50임을 나타냅니다. 🎜🎜2. AUC 면적 🎜🎜ROC 곡선을 완전히 분석하고 모델의 성능을 다른 여러 모델과 비교하려면 실제로 문헌에서 c-통계량이라고도 알려진 곡선 아래 면적(AUC)을 계산해야 합니다. . 곡선 아래 면적(AUC)은 곡선이 1x1 그리드에 표시되고 신호 이론과 평행하기 때문에 0과 1 사이의 값을 가지며 이는 신호 감지 가능성의 척도입니다. 🎜🎜이것은 모델이 실제 관찰과 거짓 관찰에 대해 얼마나 잘 평가되는지에 대한 아이디어를 제공하므로 매우 유용한 통계입니다. 이는 실제로 단일 분포에서 두 개의 정렬된 측정 샘플을 추출하는 귀무 가설을 테스트하는 Wilcoxon-Mann-Whitney 순위 합계 테스트의 정규화된 버전입니다. 🎜🎜ROC 곡선을 그리고 AUC(곡선 아래 면적)를 계산하기 위해 동일한 분류 작업을 해결하기 위해 SckitLearn의 RocCurveDisplay 방법을 사용하고 다층 퍼셉트론을 랜덤 포레스트 모델과 비교하기로 결정했습니다. 🎜

import matplotlib.pyplot as plt
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import roc_auc_score, RocCurveDisplay
def plot_roc(model, test_features, test_targets):
    """
    Plotting the ROC curve for a given Model and the ROC curve for a Random Forests Models
    """
    # comparing the given model with a Random Forests model
    random_forests_model = RandomForestClassifier(random_state=42)
    random_forests_model.fit(train_features, train_targets)
    rfc_disp = RocCurveDisplay.from_estimator(random_forests_model, test_features, test_targets)
    model_disp = RocCurveDisplay.from_estimator(model, test_features, test_targets, ax=rfc_disp.ax_)
    model_disp.figure_.suptitle("ROC curve: Multilayer Perceptron vs Random Forests")
    plt.show()
# using perceptron model as input
plot_roc(ml_percetron_model, test_features, test_targets)

🎜🎜🎜

위 내용은 Python 모델 성능 ROC 및 AUC 란 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 亿速云에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

파이썬 어레이에서 수행 할 수있는 일반적인 작업은 무엇입니까?Apr 26, 2025 am 12:22 AM

PythonArraysSupportVariousOperations : 1) SlicingExtractsSubsets, 2) 추가/확장 어드먼트, 3) 삽입 값 삽입 ATSpecificPositions, 4) retingdeletesElements, 5) 분류/ReversingChangesOrder 및 6) ListsompectionScreateNewListSbasedOnsistin

어떤 유형의 응용 프로그램에서 Numpy Array가 일반적으로 사용됩니까?Apr 26, 2025 am 12:13 AM

NumpyArraysareSentialplosplicationSefficationSefficientNumericalcomputationsanddatamanipulation. Theyarcrucialindatascience, MachineLearning, Physics, Engineering 및 Financeduetotheiribility에 대한 handlarge-scaledataefficivally. forexample, Infinancialanyaly

파이썬의 목록 위의 배열을 언제 사용 하시겠습니까?Apr 26, 2025 am 12:12 AM

UseanArray.ArrayOveralistInpyThonWhendealingwithhomogeneousData, Performance-CriticalCode, OrinterFacingwithCcode.1) HomogeneousData : ArraysSaveMemorywithtypepletement.2) Performance-CriticalCode : arraysofferbetterporcomanceFornumericalOperations.3) Interf

모든 목록 작업은 배열에 의해 지원됩니까? 왜 또는 왜 그렇지 않습니까?Apr 26, 2025 am 12:05 AM

아니요, NOTALLLISTOPERATIONARESUPPORTEDBYARRARES, andVICEVERSA.1) ArraySDONOTSUPPORTDYNAMICOPERATIONSLIKEPENDORINSERTWITHUTRESIGING, WHITHIMPACTSPERFORMANCE.2) ListSDONOTEECONSTANTTIMECOMPLEXITEFORDITITICCESSLIKEARRAYSDO.

파이썬 목록에서 요소에 어떻게 액세스합니까?Apr 26, 2025 am 12:03 AM

ToaccesselementsInapyThonlist, 사용 인덱싱, 부정적인 인덱싱, 슬라이스, 오리 화.

어레이는 파이썬으로 과학 컴퓨팅에 어떻게 사용됩니까?Apr 25, 2025 am 12:28 AM

Arraysinpython, 특히 비밀 복구를위한 ArecrucialInscientificcomputing.1) theaRearedFornumericalOperations, DataAnalysis 및 MachinELearning.2) Numpy'SimplementationIncensuressuressurations thanpythonlists.3) arraysenablequick

같은 시스템에서 다른 파이썬 버전을 어떻게 처리합니까?Apr 25, 2025 am 12:24 AM

Pyenv, Venv 및 Anaconda를 사용하여 다양한 Python 버전을 관리 할 수 있습니다. 1) PYENV를 사용하여 여러 Python 버전을 관리합니다. Pyenv를 설치하고 글로벌 및 로컬 버전을 설정하십시오. 2) VENV를 사용하여 프로젝트 종속성을 분리하기 위해 가상 환경을 만듭니다. 3) Anaconda를 사용하여 데이터 과학 프로젝트에서 Python 버전을 관리하십시오. 4) 시스템 수준의 작업을 위해 시스템 파이썬을 유지하십시오. 이러한 도구와 전략을 통해 다양한 버전의 Python을 효과적으로 관리하여 프로젝트의 원활한 실행을 보장 할 수 있습니다.

표준 파이썬 어레이를 통해 Numpy Array를 사용하면 몇 가지 장점은 무엇입니까?Apr 25, 2025 am 12:21 AM

Numpyarrayshaveseveraladvantagesstandardpythonarrays : 1) thearemuchfasterduetoc 기반 간증, 2) thearemorememory-refficient, 특히 withlargedatasets 및 3) wepferoptizedformationsformationstaticaloperations, 만들기, 만들기

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

에디트플러스 중국어 크랙 버전

작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음

Atom Editor Mac 버전 다운로드

가장 인기 있는 오픈 소스 편집기

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.

드림위버 CS6

시각적 웹 개발 도구

SecList

SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.