Maison  >  Article  >  Périphériques technologiques  >  Dix référentiels GitHub pour AutoML

Dix référentiels GitHub pour AutoML

王林
王林avant
2023-04-12 11:43:091716parcourir

Les avancées en matière d’intelligence artificielle et d’apprentissage automatique sont deux des sujets les plus passionnants des deux dernières décennies. Les ingénieurs en apprentissage automatique et en science des données nécessitent des recherches approfondies et un travail acharné pour comprendre et exécuter efficacement leurs modèles.

Dix référentiels GitHub pour AutoML

Bien qu'elles puissent varier d'une personne à l'autre, les étapes traditionnelles de l'apprentissage automatique comprennent :

  1. Acquisition de données
  2. Exploration des données
  3. Préparation des données
  4. Ingénierie des fonctionnalités
  5. Sélection
  6. Formation du modèle
  7. Hyperparamètre s Tuning
  8. Prédictions

Bien que 8 étapes puissent sembler peu lors de la création d'un modèle d'apprentissage automatique, commencer par les étapes ci-dessus prendra un certain temps pour se perfectionner !

Le problème est exacerbé lorsque des praticiens non experts en apprentissage automatique suivent ces étapes pour la première fois ; le processus prend généralement plus de temps et de ressources, et même dans ce cas, le résultat final peut ne pas être celui attendu.

AutoML est pratique en automatisant une grande partie du processus de création de modèles pour les experts et les non-experts.

Qu'est-ce que l'apprentissage automatique (AutoML) ?

L'apprentissage automatique automatisé, souvent appelé AutoML, facilite l'apprentissage automatique. AutoML rend l'apprentissage automatique plus accessible aux experts non experts en apprentissage automatique grâce au traitement automatisé effectué par un framework donné.

Il se concentre sur l’accélération de la recherche sur l’intelligence artificielle et l’amélioration de l’efficacité des modèles d’apprentissage automatique.

Le processus d'apprentissage automatique traditionnel se concentre sur les 8 étapes mentionnées précédemment, tandis qu'AutoML couvre deux étapes :

  1. L'acquisition de données est le processus de collecte, de filtrage et de nettoyage des données utilisées avant de les stocker dans l'entrepôt de données.
  2. La prédiction fait référence à la sortie réelle renvoyée par un modèle donné, un modèle entraîné est susceptible de renvoyer une prédiction finale précise.

Le cadre d'exploration des données, de préparation des données, d'ingénierie des fonctionnalités, de sélection du modèle, de formation du modèle et de réglage final du modèle couvrira les 6 autres étapes.

Avantages d'AutoML

  • Productivité améliorée
  • Meilleurs résultats finaux
  • Erreurs minimisées
  • Apprentissage automatique étendu

Frameworks populaires pour AutoML

Maintenant que nous avons discuté de ce qu'est AutoML et compris certains de ses avantages, nous allons présentez les 10 meilleurs frameworks AutoML, où les trouver et les fonctionnalités qu'ils offrent.

1. Google AutoML

Google AutoML est l'un des frameworks les plus connus disponibles et se classe premier dans notre liste. Google a lancé de nombreux frameworks AutoML, tels que Google AutoML vision, Google AutoML Natural Language, etc.

2. SKLearn automatique

Les utilisateurs qui ont déjà été exposés à l'apprentissage automatique connaissent peut-être le nom SKlearn. En tant que complément à la populaire bibliothèque sci-kit-learn, Auto SKLearn est un framework d'apprentissage automatique open source qui gère l'automatisation des tâches d'apprentissage automatique.

Le framework Auto Sklearn est capable d'effectuer la sélection de modèles, le réglage et la caractérisation des hyperparamètres, ce qui est une caractéristique unique du framework Auto SKlearn.

En effectuant la sélection du modèle, Auto SKlearn recherchera automatiquement le meilleur algorithme capable de résoudre le problème posé par l'utilisateur.

Passons à la deuxième fonctionnalité d'Auto SKlearn, nous avons le réglage des hyperparamètres. Comme l'une des étapes finales de tout modèle de machine ou d'apprentissage profond, les utilisateurs doivent trouver les meilleurs paramètres de modèle pour optimiser les résultats. Cette tâche nécessite beaucoup de temps et peut être facilement automatisée grâce à de tels frameworks.

L'avantage unique et ultime de l'utilisation d'Auto SKlearn est sa capacité à effectuer une caractérisation automatique. La La représentation est le processus de transformation des données brutes en informations utilisables.

3.TPot

TPOT, également connu sous le nom d'outil d'optimisation de pipeline d'arbre, est l'un des premiers progiciels autoML open source python. Il se concentre sur l’optimisation des pipelines d’apprentissage automatique à l’aide de la programmation génétique.

L'objectif principal de TPOT est de créer automatiquement des pipelines ML en combinant des représentations flexibles d'arbres d'expression de pipelines avec des algorithmes de recherche stochastiques tels que la programmation génétique.

Veuillez noter que TPOT fonctionne au-dessus de la bibliothèque sci-kit-learn qui doit être installée en premier.

4.AutoKeras

AutoKeras est une bibliothèque open source conçue pour AutoML et les modèles d'apprentissage en profondeur, développée à l'origine par DATA Labs.

Auto Keras aide les passionnés de machine et d'apprentissage profond non experts à exécuter et entraîner leurs modèles avec un minimum d'effort. Auto Keras vise à rendre l'apprentissage automatique accessible à tous et constitue un excellent outil pour les débutants

5. Ludwig

Ludwig est un framework autoML open source qui se concentre principalement sur l'assemblage et la formation de modèles d'apprentissage en profondeur à l'aide d'un système de fichiers de configuration simple.

En permettant à l'utilisateur de fournir un fichier de configuration qui définit les entrées et sorties d'un modèle donné et leurs types de données respectifs, le framework Ludwig exploitera ces données pour construire son modèle d'apprentissage en profondeur basé sur les propriétés mentionnées précédemment.

6. MLBOX

MLBOX est en plein essor et devient rapidement l'un des meilleurs outils de framework d'apprentissage automatique automatisé.

Selon la Documentation officielle de MLBOX, il offre les avantages suivants :

  • Lecture rapide et prétraitement/nettoyage/formatage des données distribuées.
  • Sélection de fonctionnalités et détection de fuites très robustes.
  • Optimisation précise des hyperparamètres dans un espace de grande dimension.
  • Modèles de classification et de prédiction de régression de pointe (deep learning, stacking, LightGBM, etc.).
  • Utilisez les explications du modèle pour faire des prédictions.

7. AutoGloun

AutoGloun s'adresse aux praticiens experts et non-experts en apprentissage automatique, se concentrant sur l'intégration de la pile d'automatisation, l'apprentissage en profondeur et les applications du monde réel à travers des images, du texte et des données tabulaires.

Selon la Documentation en ligne d'AutoGloun, AutoGLoun permet aux utilisateurs de :

  • Prototypage rapide de solutions d'apprentissage profond et de ML classiques pour les données brutes avec seulement quelques lignes de code.
  • Exploitez automatiquement la technologie de pointe (le cas échéant) sans expertise.
  • Tirez parti du réglage automatique des hyperparamètres, de la sélection/intégration de modèles, de la recherche d'architecture et du traitement des données.
  • Améliorez/modifiez facilement les modèles personnalisés et les pipelines de données, ou personnalisez AutoGluon pour des cas d'utilisation spécifiques.

8. Microsoft Neural Network Intelligence (NNI)

Microsoft Neural Network Intelligence, également connue sous le nom de NNI, est une boîte à outils conçue pour automatiser l'ingénierie des fonctionnalités, la recherche d'architecture neuronale, le réglage des hyperparamètres et la compression de modèles pour l'apprentissage en profondeur.

L'outil NNI prend en charge PyTorch, TensorFlow, Scikit-learn, XGBoost, LightGBM et d'autres frameworks. Le principal avantage de l'utilisation de Microsoft Neural Network est la recherche d'architecture neuronale, les outils NNI prennent en charge la recherche multi-pistes (recherche de grille, évolution régularisée, IRL basée sur des politiques, etc.) et la recherche d'architecture neuronale ponctuelle (DARTS, ENAS FBNet, etc.). .

Cet outil fournit une variété d'algorithmes de réglage d'hyperparamètres, tels que l'optimisation bayésienne, la recherche exhaustive et la recherche heuristique. Consultez le fichier Readme de NNI sur Github pour en savoir plus sur ce que cet outil a d'autre à offrir.

9. TransmogrifAI

TransmogrifAI est conçu pour aider les développeurs à augmenter la productivité de l'apprentissage automatique. TransmogrifAI fonctionne sur Apache Spark.

Comme brièvement mentionné dans le fichier readme de Github sur Transmogrif, "Avec l'automatisation, il peut atteindre une précision proche du réglage manuel du modèle, et en près de 100 fois moins de temps

Identique aux autres frameworks autoML mentionnés. De même, le TransmogrifAI. " L'outil est capable de sélectionner le meilleur algorithme pour un ensemble de données sélectionné par l'utilisateur.

10. H2O Automatic Machine Learning

H2O autoML est un outil de framework open source créé par H2O et prend en charge la programmation R et Python.

Il prend également en charge les algorithmes statistiques et d'apprentissage automatique les plus largement utilisés, notamment les machines d'augmentation de gradient, les modèles linéaires généralisés et l'apprentissage profond.

L'interface H2O autoML s'adapte aux nouveaux utilisateurs de machine learning en exigeant le moins de paramètres possible. La tâche principale de l'utilisateur lors de l'utilisation de l'outil H2O est de fournir l'ensemble de données.

Autres outils AutoML utiles

1. Hypertunity

Hypertunity est un outil léger conçu pour optimiser un hyperparamètre donné d'un modèle à l'aide d'un package léger. Ils sont modulaires, simples et extensibles pour permettre des implémentations de planification transparentes.

Hypertunity prend en charge l'optimisation bayésienne à l'aide de GPyOpt, des planificateurs compatibles Slurm et la visualisation en temps réel à l'aide de Tensorboard (via le plugin HParams).

2. Dragonfly

Dragonfly est un outil autoML open source conçu pour une optimisation bayésienne évolutive.

L'optimisation bayésienne est utilisée pour évaluer des fonctions de boîte noire très coûteuses au-delà de l'optimisation ordinaire.

Dragonfly permet aux nouveaux utilisateurs de résoudre des erreurs d'optimisation bayésienne évolutives avec un minimum de connaissances.

3. Ray Tune

En tant que deuxième outil d'optimisation d'hyperparamètres, Ray Tune est un cadre unifié pour la mise à l'échelle des applications IA et Python.

Il permet une mise à l'échelle simple de la charge de travail de l'IA grâce au traitement des données distribuées, à la formation distribuée, au réglage des hyperparamètres évolutifs, à l'apprentissage par renforcement évolutif et aux services programmables évolutifs.

4. Apprentissage automatique des graphiques

Auto Graph Learning est un framework autoML unique qui se concentre sur l'apprentissage automatique des ensembles de données graphiques, très simple et simple.

Ils utilisent des ensembles de données pour gérer des ensembles de données pour l'apprentissage automatique basé sur des graphiques basés sur Pytorch Geometry ou sur les ensembles de données de la bibliothèque Deep Graph.

Référentiel GitHub pour l'apprentissage automatique automatisé

Avec les progrès dans le domaine de l'apprentissage automatique et profond, le besoin d'experts en apprentissage automatique a considérablement augmenté sans être pris en compte.

C'est là qu'intervient l'automatisation avec des outils et des techniques d'apprentissage automatique, permettant aux nouveaux utilisateurs de créer des modèles entièrement fonctionnels et hautement optimisés plus facilement que jamais.

En bref, lorsque vous recherchez l'outil d'apprentissage automatique automatisé parfait, vous devez vous concentrer sur ce que vous essayez de réaliser avec un modèle donné et sur la partie exacte du processus d'apprentissage automatique que vous souhaitez automatiser. Nous vous recommandons d'essayer vous-même plusieurs des outils AutoML ci-dessus et d'utiliser uniquement ceux que vous trouvez efficaces et faciles à utiliser.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer