Maison >Périphériques technologiques >IA >Introduire le concept de validation croisée et les méthodes communes de validation croisée

Introduire le concept de validation croisée et les méthodes communes de validation croisée

王林
王林avant
2024-01-23 18:15:211556parcourir

交叉验证的概念 常见交叉验证的方法介绍

La validation croisée est une méthode d'évaluation des performances des modèles d'apprentissage automatique couramment utilisée. Il divise l'ensemble de données en plusieurs sous-ensembles qui ne se chevauchent pas, dont une partie sert d'ensemble de formation et le reste sert d'ensemble de test. Grâce à la formation et aux tests de plusieurs modèles, les performances moyennes du modèle sont obtenues en tant qu'estimation des performances de généralisation. La validation croisée peut évaluer plus précisément la capacité de généralisation du modèle et éviter les problèmes de surajustement ou de sous-ajustement.

Les méthodes de validation croisée couramment utilisées sont les suivantes :

1 Validation croisée simple

Habituellement, nous divisons l'ensemble de données en un ensemble d'entraînement et un ensemble de test, dont l'ensemble d'entraînement. représente 70 % du total des données à 80 %, et les données restantes sont utilisées comme ensemble de test. Utilisez l’ensemble de formation pour entraîner le modèle, puis utilisez l’ensemble de test pour évaluer les performances du modèle. Un inconvénient de cette approche est qu’elle est très sensible à la façon dont l’ensemble de données est divisé. Si la séparation des ensembles de formation et de test est inappropriée, elle peut conduire à des évaluations inexactes des performances du modèle. Par conséquent, le choix d’une méthode de segmentation appropriée est très important pour obtenir des résultats précis d’évaluation du modèle.

2. Validation croisée K-fold

Divisez l'ensemble de données en K parties, utilisez une partie comme ensemble de test à chaque fois et les parties K-1 restantes comme ensemble d'entraînement, puis entraînez le modèle. et tester. Répétez K fois, en utilisant à chaque fois différentes parties comme ensembles de tests, et enfin faites la moyenne des K résultats d'évaluation pour obtenir les résultats d'évaluation des performances du modèle. L'avantage de cette approche est qu'elle n'est pas sensible à la façon dont l'ensemble de données est divisé, ce qui permet une évaluation plus précise des performances du modèle.

3. Validation croisée de la méthode d'amorçage

Cette méthode sélectionne d'abord au hasard n échantillons dans l'ensemble de données avec remplacement comme ensemble d'entraînement, et les échantillons restants sont utilisés comme ensemble de test pour entraîner et tester le modèle. Ensuite, remettez l'ensemble de test dans l'ensemble de données, sélectionnez au hasard n échantillons comme ensemble d'apprentissage et les échantillons restants comme ensemble de test, répétez K fois. Enfin, les résultats de l'évaluation des performances du modèle sont obtenus en faisant la moyenne des résultats de l'évaluation K. L'avantage de la validation croisée bootstrap est qu'elle peut utiliser pleinement tous les échantillons de l'ensemble de données, mais l'inconvénient est qu'elle réutilise les échantillons, ce qui peut conduire à une plus grande variance dans les résultats de l'évaluation.

4. Validation croisée sans intervention

Cette méthode consiste à utiliser chaque échantillon comme un ensemble de test pour entraîner et tester le modèle, en répétant K fois. Enfin, les résultats d'évaluation des performances du modèle sont obtenus en faisant la moyenne des résultats d'évaluation K. L’avantage de la validation croisée sans intervention est qu’elle est plus précise dans l’évaluation de petits ensembles de données. L’inconvénient est qu’elle nécessite une grande quantité de formation et de tests du modèle et que le coût de calcul est élevé.

5. Validation croisée stratifiée

Cette méthode est basée sur la validation croisée K-fold, stratifiant l'ensemble de données en fonction des catégories pour garantir que la proportion de chaque catégorie dans l'ensemble d'entraînement et l'ensemble de test est la même. même. Cette méthode convient aux problèmes de multi-classification où le nombre d’échantillons entre classes est déséquilibré.

6. Validation croisée des séries chronologiques

Cette méthode est une méthode de validation croisée pour les données de séries chronologiques. Elle évite d'utiliser des données futures pour entraîner le modèle en divisant l'ensemble d'entraînement et l'ensemble de test dans l'ordre chronologique. La validation croisée des séries chronologiques utilise généralement une méthode de fenêtre glissante, c'est-à-dire faire avancer l'ensemble d'entraînement et l'ensemble de tests d'un certain pas de temps, et entraîner et tester le modèle à plusieurs reprises.

7. Validation croisée répétée

Cette méthode est basée sur une validation croisée K-fold, une validation croisée répétée plusieurs fois, en utilisant à chaque fois différentes graines aléatoires ou différentes méthodes de partitionnement d'ensembles de données, et finalement plusieurs fois. les résultats d'évaluation des performances du modèle sont obtenus en faisant la moyenne des résultats d'évaluation. Une validation croisée répétée peut réduire la variance des résultats de l'évaluation des performances du modèle et améliorer la fiabilité de l'évaluation.

En bref, la méthode de validation croisée est une méthode d'évaluation de modèle très importante dans le domaine de l'apprentissage automatique. Elle peut nous aider à évaluer les performances du modèle avec plus de précision et à éviter les problèmes de sur-ajustement ou de sous-ajustement. Différentes méthodes de validation croisée conviennent à différents scénarios et ensembles de données, et nous devons choisir la méthode de validation croisée appropriée en fonction de la situation spécifique.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer