Maison >Périphériques technologiques >IA >Le concept d'autoformation et son lien avec l'apprentissage semi-supervisé

Le concept d'autoformation et son lien avec l'apprentissage semi-supervisé

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB
WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBavant
2024-01-23 17:15:05727parcourir

Le concept dautoformation et son lien avec lapprentissage semi-supervisé

L'auto-formation est une méthode de classification semi-supervisée qui inclut des hypothèses de finesse et de regroupement. C’est pourquoi on l’appelle également auto-étiquetage ou apprentissage orienté décision.

Généralement, l'auto-formation est un bon choix lorsque l'ensemble de données étiqueté contient de nombreuses informations sur le processus de génération de données et que les échantillons non étiquetés ne sont utilisés que pour affiner l'algorithme.

Cependant, lorsque ces conditions ne sont pas réunies, les résultats de l'auto-formation ne sont pas idéaux. L’auto-formation dépend donc fortement des échantillons étiquetés.

Chaque étape de l'auto-formation étiquette les données non étiquetées en fonction de la fonction de décision actuelle et se recycle à l'aide de prédictions.

Comment fonctionne l'auto-formation

Auto-entraîner un algorithme pour qu'il s'adapte aux pseudo-étiquettes prédites par un autre modèle supervisé précédemment appris.

L'auto-formation comporte ces points clés

Les instances de données sont divisées en ensembles d'entraînement et en ensembles de tests, et l'algorithme de classification est entraîné sur les données d'entraînement étiquetées. Évaluez les points de données et utilisez des vecteurs de confiance pour représenter les prédictions.

2. Sélectionnez les principales valeurs K associées à la confiance maximale et ajoutez-les à l'ensemble de données étiqueté.

3. Le classificateur prédit l'étiquette de classe de l'instance de données de test étiquetée et évalue les performances du classificateur à l'aide de la métrique sélectionnée.

4. Le classificateur est recyclé en utilisant le nouvel ensemble de données étiquetées.

L'auto-formation exploite la structure d'ensembles de données étiquetés pour découvrir des hypersurfaces de séparation appropriées. Après ce processus, les échantillons non étiquetés sont évalués et les points classés avec suffisamment de confiance sont inclus dans le nouvel ensemble d'apprentissage. L'algorithme d'auto-apprentissage répète ce processus jusqu'à ce que chaque point de données soit classé.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer