Maison > Article > Périphériques technologiques > Utilisez un exemple pour montrer comment comprendre la matrice de confusion d'une classe binaire
Confusion Matrix est un modèle d'évaluation qui aide les ingénieurs en apprentissage automatique à mieux comprendre les performances du modèle. Cet article prend comme exemple un ensemble de données déséquilibrées de classe binaire. L'ensemble de test se compose de 60 échantillons de classe positive et de 40 échantillons de classe négative pour évaluer le modèle d'apprentissage automatique.
L'ensemble de données de classe binaire ne comporte que deux catégories de données différentes, qui peuvent être simplement nommées catégories « positives » et « négatives ».
Maintenant, pour bien comprendre la matrice de confusion de ce problème de classification binaire, nous devons d'abord nous familiariser avec les termes suivants :
Vrai Positif (TP) signifie que les échantillons appartenant à la classe positive sont correctement classés.
True Negative (TN) signifie que les échantillons appartenant à la classe négative sont correctement classés.
Faux Positif (FP) signifie que les échantillons appartenant à la classe négative sont classés à tort comme appartenant à la classe positive.
Faux Négatif (FN) signifie que les échantillons appartenant à la classe positive sont classés à tort dans la classe négative.
Un exemple de matrice de confusion que nous pouvons obtenir en entraînant le modèle est présenté ci-dessus pour cet exemple d'ensemble de données.
En additionnant les chiffres de la première colonne, nous voyons que le nombre total d'échantillons dans la classe positive est de 45+15=60. Additionnez les nombres de la deuxième colonne pour obtenir le nombre d’échantillons dans la classe négative, qui est de 40 dans ce cas. La somme des nombres dans toutes les cases donne le nombre total d'échantillons évalués. De plus, les catégories correctes sont les éléments diagonaux de la matrice – 45 positifs et 32 négatifs.
Maintenant, le modèle classe la case inférieure gauche comme un échantillon positif, elle est donc appelée « FN » car le « négatif » prédit par le modèle est faux. De même, la case supérieure droite devrait appartenir à la classe négative, mais est classée comme « positive » par le modèle. C’est pourquoi ils sont appelés « FP ». Nous pouvons évaluer le modèle plus attentivement en utilisant ces quatre nombres différents dans la matrice.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!