Maison >Périphériques technologiques >IA >L'Université Tsinghua lance CurML, la première bibliothèque open source pour l'apprentissage des cours

L'Université Tsinghua lance CurML, la première bibliothèque open source pour l'apprentissage des cours

PHPz
PHPzavant
2023-04-09 08:41:021196parcourir

Dans le processus de développement de l'apprentissage automatique, les méthodes d'apprentissage humain inspirent souvent la conception de divers algorithmes. En tant que paradigme important de l’apprentissage humain, l’apprentissage par le biais de cours a été emprunté à l’apprentissage automatique pour former une direction de recherche appelée Curriculum Learning.

D'une manière générale, l'éducation humaine se complète à travers des cours très organisés. Chaque cours ou matière commencera par un contenu simple et présentera progressivement aux étudiants des concepts plus complexes. Par exemple, avant d’accepter les concepts de calcul au collège, un élève doit d’abord apprendre l’arithmétique à l’école primaire, les fonctions au collège et les dérivées au lycée. Cependant, contrairement à l’éducation humaine, la formation de modèles d’apprentissage automatique traditionnels implique la saisie aléatoire d’échantillons de données dans le modèle, ignorant les différentes complexités entre les échantillons de données et l’état d’apprentissage actuel du modèle. Par conséquent, l'apprentissage curriculaire a été proposé dans le domaine de l'apprentissage automatique précisément pour imiter l'apprentissage humain du facile au difficile, fournir de meilleures stratégies de formation pour le modèle et ainsi améliorer les performances du modèle.

LUniversité Tsinghua lance CurML, la première bibliothèque open source pour lapprentissage des cours

Carte conceptuelle d'apprentissage du cours

Actuellement, l'apprentissage du cours a été largement utilisé dans diverses tâches d'apprentissage automatique, notamment la classification d'images, la détection de cibles, la segmentation sémantique, la traduction automatique, la reconnaissance audio, l'audio L'amélioration, la réponse aux questions vidéo, etc., ont également fait l'objet de beaucoup d'attention et de recherches dans des scénarios tels que l'apprentissage supervisé, non supervisé et semi-supervisé et l'apprentissage par renforcement.

À mesure que les applications et les scénarios d'apprentissage des cours deviennent de plus en plus riches, il est particulièrement nécessaire de procéder à un tri et une synthèse détaillés dans ce domaine, afin de favoriser une exploration approfondie par les chercheurs et d'améliorer l'expérience applicative des utilisateurs.

Par conséquent, sur la base de l'accumulation et du fondement de la publication d'un certain nombre d'articles universitaires sur l'apprentissage du curriculum, le laboratoire Big Data des médias et des réseaux dirigé par le professeur Zhu Wenwu de l'Université Tsinghua, membre du laboratoire Wang Xin, a publié un article sur l'apprentissage du curriculum à IEEE TPAMI Dans le document de synthèse, le laboratoire a en outre publié la première bibliothèque open source au monde pour l'apprentissage de cours, CurML (Curriculum Machine Learning).

Les travaux de recherche du professeur Zhu Wenwu et du chercheur adjoint Wang Xin comprennent une méthode de méta-apprentissage de cours appliquée à la recommandation d'emplacement d'intérêt urbain, une recommandation de produit de découplage de cours basée sur des informations multi-feedback bruyantes et un paramètre neuronal partagé basé sur l'architecture d'apprentissage du cours. recherche et résolution de problèmes d'optimisation combinatoire basée sur l'adaptation de la difficulté du cours, etc. Les résultats de la recherche ont été publiés lors de conférences internationales de haut niveau sur l'apprentissage automatique telles que SIGKDD, NeurIPS et ACM MM.

LUniversité Tsinghua lance CurML, la première bibliothèque open source pour lapprentissage des cours

Diagramme-cadre de certains résultats de recherche

Le document de révision de l'apprentissage du cours examine de manière exhaustive l'émergence, la définition, la théorie et l'application de l'apprentissage du cours, et conçoit un cadre d'apprentissage unifié et en fonction. Aux composants centraux du cadre, les algorithmes d'apprentissage de cours sont divisés en deux catégories principales et plusieurs sous-catégories, distinguant les différences et les corrélations entre l'apprentissage de cours et d'autres concepts d'apprentissage automatique, et soulignant les défis et l'avenir de ce domaine. Orientations de recherche possibles.

LUniversité Tsinghua lance CurML, la première bibliothèque open source pour lapprentissage des cours

Classification des méthodes d'apprentissage de cours

La bibliothèque open source CurML est une plate-forme de support pour les algorithmes d'apprentissage de cours. Elle a intégré plus de dix algorithmes d'apprentissage de cours, prenant en charge à la fois bruyants et non bruyants. bruyant. Un scénario d'application qui permet aux chercheurs et aux utilisateurs de reproduire, évaluer, comparer et sélectionner des algorithmes d'apprentissage de cours.

Le module principal de CurML est CL Trainer, qui se compose de deux sous-modules Model Trainer et CL Algorithm. Les deux interagissent via cinq fonctions d'interface pour réaliser le processus d'apprentissage automatique de l'orientation de l'apprentissage du cours.

LUniversité Tsinghua lance CurML, la première bibliothèque open source pour lapprentissage des cours

Diagramme du framework CurML

Module principal : CL Trainer

Ce module est la partie principale de toute la bibliothèque open source. En appelant ce module, les utilisateurs peuvent implémenter l'algorithme d'apprentissage du cours avec seulement quelques lignes de code. Après avoir reçu l'ensemble de données, le modèle et les hyperparamètres, le module s'entraînera pendant une certaine période de temps et produira les paramètres du modèle entraîné et les résultats des tests de la tâche. Ce module est principalement conçu pour répondre aux exigences de facilité d'utilisation, il est donc hautement encapsulé et fourni aux utilisateurs qui souhaitent utiliser l'algorithme d'apprentissage du cours mais ne se soucient pas des détails spécifiques de mise en œuvre.

Sous-module 1 : Model Trainer

Ce module est utilisé pour compléter le processus général d'apprentissage automatique, comme la formation d'un classificateur d'images ou d'un modèle de langage. Dans le même temps, il réserve des positions pour cinq fonctions d'interface pour interagir avec l'algorithme CL du deuxième sous-module, et prend également en charge les fonctions d'entrée personnalisées.

Sous-module 2 : Algorithme CL

Ce module encapsule tous les algorithmes d'apprentissage de cours pris en charge par CurML, comme indiqué dans le tableau suivant :

LUniversité Tsinghua lance CurML, la première bibliothèque open source pour lapprentissage des cours

Le module est implémenté via cinq interfaces Fonctions sont utilisés pour obtenir des données et des informations sur le modèle à partir du processus d'apprentissage automatique et pour guider la stratégie d'apprentissage du modèle, comme le montre la figure ci-dessous.

LUniversité Tsinghua lance CurML, la première bibliothèque open source pour lapprentissage des cours

Organigramme CurML

Fonction d'interface : data_prepare

Cette fonction est utilisée pour fournir des informations sur l'ensemble de données du module Model Trainer au module CL Algorithm. De nombreux algorithmes d'apprentissage de cours nécessitent une compréhension globale de l'ensemble de données afin de mieux juger de la difficulté de l'échantillon de données, cette fonction d'interface est donc nécessaire.

Fonction d'interface : model_prepare

Cette fonction est très similaire à data_prepare. La différence est qu'elle ne transfère pas d'informations sur l'ensemble de données mais des informations liées à la formation du modèle, telles que l'architecture du modèle, l'optimiseur de paramètres et l'apprentissage. ajusteur de taux. Etc., de nombreux algorithmes d'apprentissage de cours guident l'apprentissage automatique en ajustant ces facteurs.

Fonction d'interface : data_curriculum

Cette fonction est utilisée pour calculer la difficulté de l'échantillon de données et fournir des données appropriées pour le modèle en fonction de la difficulté des données et de l'état actuel du modèle. La plupart des études de cours ont des idées similaires. .

Fonction d'interface : model_curriculum

Cette fonction est utilisée pour mettre à jour le modèle, ajuster la quantité d'informations que le modèle obtient à partir d'échantillons de données et guider indirectement l'apprentissage du modèle actuellement, le nombre de ces informations. Les algorithmes sont encore petits, mais CurML prend également en charge la mise en œuvre de tels algorithmes.

Fonction d'interface : loss_curriculum

Cette fonction est utilisée pour repondérer la valeur de la fonction de perte et ajuster indirectement l'impact des différentes données sur le modèle. Ce type d'algorithme est plus courant dans l'apprentissage de cours, car la perte. La pondération des valeurs est essentiellement un échantillonnage doux des données.

Grâce au résumé de plus de dix méthodes d'apprentissage de cours ces dernières années, différents types d'algorithmes d'apprentissage de cours peuvent être unifiés et mis en œuvre à l'aide des modules et des paramètres d'interface ci-dessus, afin que les algorithmes d'apprentissage de cours puissent être évalués dans des scénarios équitables et tâches. , comparer et choisir.

Future Outlook

L'équipe R&D de CurML a déclaré qu'elle continuerait à mettre à jour cette bibliothèque open source à l'avenir pour fournir un soutien supplémentaire au développement et à l'application de l'apprentissage des cours.

Liens connexes :

  • Lien de la bibliothèque de code open source CurML : https://github.com/THUMNLab/CurML
  • Lien papier du logiciel open source CurML : https://dl.acm.org /doi /pdf/10.1145/3503161.3548549
  • Lien du document de révision de l'apprentissage du cours : https://ieeexplore.ieee.org/abstract/document/9392296/
  • Lien du document de méta-apprentissage du cours : https://dl .acm.org/doi/abs/10.1145/3447548.3467132
  • Lien du document d'apprentissage sur le découplage du cours : https://proceedings.neurips.cc/paper/2021/file/e242660df1b69b74dcc7fde711f924ff-Paper.pdf
  • Cours Architecture Neurale Lien de recherche sur l'article : https://dl.acm.org/doi/abs/10.1145/3503161.3548271
  • Lien sur l'article adaptatif de difficulté du cours : https://ojs.aaai.org/index.php/AAAI/article/download /20899/version/19196/20658

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer