Maison > Article > Périphériques technologiques > Bases de l'intelligence artificielle : introduction aux algorithmes courants dans l'apprentissage automatique
Aujourd’hui je vais vous parler des algorithmes de machine learning, jetons un coup d’œil !
Les algorithmes d'apprentissage automatique comprennent principalement l'apprentissage supervisé, l'apprentissage non supervisé, l'apprentissage semi-supervisé, l'apprentissage par transfert et l'apprentissage par renforcement.
L'apprentissage supervisé est un type d'apprentissage automatique très courant dans l'apprentissage automatique, qui consiste à entraîner un modèle lorsque l'entrée et la sortie sont connues et à mapper l'entrée à la sortie.
Caractéristiques : des objectifs d'apprentissage (tels que des valeurs réelles, des annotations, etc.) sont donnés.
L'apprentissage supervisé peut être divisé en classification et régression selon que le résultat cible est discret ou continu.
Ce type de valeur cible de prédiction est discret. Par exemple, si vous prédisez s'il pleuvra, il n'y a que deux résultats finaux, pluie ou pas de pluie.
Objectif : prédire les résultats de classification de nouveaux échantillons sur la base des résultats historiques. La tâche de deux résultats de classification est appelée une tâche binaire ; deux résultats de classification ou plus sont appelés une tâche multi-classification.
Algorithmes courants : arbre de décision, forêt aléatoire, algorithme du K-voisin le plus proche, régression logistique, machine à vecteurs de support, réseau de neurones artificiels.
La valeur cible de prédiction de ce type est continue. Un exemple typique est de prédire la tendance des prix d'un certain bien immobilier.
Algorithmes : Régression linéaire, AdaBoosting, etc.
La caractéristique de l'apprentissage non supervisé est qu'il n'est pas nécessaire de penser à l'annotation des données, mais à l'auto-apprentissage et à la consolidation continus basés sur le modèle, et enfin à l'apprentissage par l'auto-résumé. Le modèle d'apprentissage comprend principalement le clustering et la réduction de dimensionnalité.
fait principalement référence au processus de formation d'une collection d'objets physiques ou abstraits en plusieurs catégories à partir d'objets similaires, ce qui peut être compris comme un regroupement selon des principes similaires.
Algorithme : les plus courants incluent l'algorithme K-means, l'algorithme BIRCH et l'algorithme DBSCAN.
Les données de grande dimension dépendent fortement des ressources du système et des performances des algorithmes. La réduction de la dimensionnalité consiste à traiter des informations sans importance dans des données de grande dimension tout en conservant la plupart des informations importantes. Pour faire simple, il s’agit d’un processus allant du complexe au simple. Si vous simplifiez au maximum les problèmes complexes, il sera beaucoup moins difficile de les résoudre.
Avantages : économisez de l'espace, gagnez du temps consommé par les algorithmes et réduisez la consommation des ressources système.
Algorithme : Algorithme d'analyse en composantes principales (ACP)
Une méthode d'apprentissage qui combine l'apprentissage supervisé et l'apprentissage non supervisé. L'apprentissage semi-supervisé utilise de grandes quantités de données non étiquetées, ainsi que des données étiquetées, pour effectuer la reconnaissance de formes.
L'apprentissage semi-supervisé convient à un petit nombre d'échantillons étiquetés et à un grand nombre d'échantillons non étiquetés, et peut obtenir des prédictions plus précises.
L'apprentissage par transfert fait référence à une méthode d'apprentissage dans laquelle un modèle pré-entraîné est réutilisé dans une autre tâche d'apprentissage.
Domaine source : connaissances existantes ; domaine cible : nouvelles connaissances à apprendre.
L'apprentissage par renforcement est également appelé apprentissage par renforcement, apprentissage par évaluation et apprentissage par renforcement, qui est l'un des paradigmes et des méthodologies de l'apprentissage automatique.
La tâche de l'apprentissage par renforcement est de permettre aux appareils intelligents d'apprendre et d'essayer en permanence comme les humains, puis de créer la solution la plus idéale dans différents environnements, de renforcer le processus de prise de décision continue et de découvrir laquelle, grâce à des essais continus, est la meilleure. meilleure façon.
Cas : AlphaGo a utilisé un algorithme d'apprentissage par renforcement pour vaincre le champion du monde Lee Sedol, l'algorithme de recommandation de vidéos Google YouTube, etc.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!