Maison  >  Article  >  Périphériques technologiques  >  Décomposition matricielle de Poisson : un algorithme de décomposition matricielle qui résout le problème de démarrage à froid des systèmes de recommandation sans données

Décomposition matricielle de Poisson : un algorithme de décomposition matricielle qui résout le problème de démarrage à froid des systèmes de recommandation sans données

WBOY
WBOYavant
2023-04-14 10:31:02839parcourir

Auteur | Wang Hao

Critique | Sun Shujuan

Le système de recommandation est l'une des technologies les plus populaires de l'industrie Internet. Au cours de la dernière décennie, l’industrie Internet a produit des millions de versions itératives de modèles de systèmes de recommandation. Bien qu’il existe de nombreux modèles de systèmes de recommandation optimisés pour différents scénarios, il existe très peu de modèles classiques. La décomposition matricielle est un algorithme de système de recommandation qui a émergé au début du domaine des systèmes de recommandation et a montré son importance dans la compétition Netflix. C'est également l'algorithme de système de recommandation le plus réussi des dix dernières années. Bien qu'aujourd'hui en 2023, le domaine des systèmes de recommandation ait longtemps été dominé par l'apprentissage profond, la décomposition matricielle est encore largement utilisée dans les processus de recherche et développement des grandes entreprises, et de nombreux chercheurs scientifiques travaillent encore sur des algorithmes associés.

Décomposition matricielle de Poisson : un algorithme de décomposition matricielle qui résout le problème de démarrage à froid des systèmes de recommandation sans données

L'article le plus classique sur l'algorithme de factorisation matricielle est la factorisation matricielle probabiliste de 2007. Sur cette base, les générations suivantes ont réalisé de nombreux travaux d'expansion, comme RankMat en 2021 (adresse de téléchargement papier : https://arxiv.org/abs/2204.13016), ZeroMat (adresse de téléchargement papier : https://arxiv.org/abs/2204.13016). org /abs/2112.03084) et DotMat en 2022 (adresse de téléchargement du papier : https://arxiv.org/abs/2206.00151), KL-Mat (adresse de téléchargement du papier : https://arxiv.org/abs/2204.13583/ code download Adresse : https://github.com/haow85/KL-Mat), etc. Les systèmes de recommandation sont très appréciés des ingénieurs du secteur Internet en raison de leur simplicité, de leur facilité d'utilisation et de leur rapidité.

Le problème du démarrage à froid des systèmes de recommandation est un autre point chaud de la recherche qui a beaucoup retenu l'attention cette année. Les idées de nombreux praticiens pour résoudre les systèmes de recommandation sont l'apprentissage par transfert et le méta-apprentissage. Cependant, cette idée présente un défaut fatal : elle nécessite des données provenant d’autres domaines de connaissances. De nombreuses entreprises ne remplissent pas cette condition. L’algorithme de démarrage à froid, qui ne nécessite en réalité aucune donnée, est apparu après la proposition de ZeroMat en 2021. Les algorithmes représentatifs incluent ZeroMat et DotMat mentionnés dans la section précédente. L'algorithme de décomposition matricielle de Poisson (PoissonMat) qui sera présenté dans cet article est un article publié lors de la Conférence académique internationale MLISE 2022. Le nom de l'article est PoissonMat : Remodelage de la factorisation matricielle à l'aide de la distribution de Poisson et résolution du problème de démarrage à froid sans données d'entrée (adresse de téléchargement de l'article : https://arxiv.org/abs/2212.10460).

Nous examinons d'abord la définition MAP de la factorisation matricielle probabiliste :

Décomposition matricielle de Poisson : un algorithme de décomposition matricielle qui résout le problème de démarrage à froid des systèmes de recommandation sans données

Nous définissons ensuite le comportement des utilisateurs évaluant les éléments comme une distribution de Poisson. D'après la définition de la distribution de Poisson, on obtient la formule suivante :

Décomposition matricielle de Poisson : un algorithme de décomposition matricielle qui résout le problème de démarrage à froid des systèmes de recommandation sans données

D'après la définition des paramètres dans la formule de Poisson, on a :

Décomposition matricielle de Poisson : un algorithme de décomposition matricielle qui résout le problème de démarrage à froid des systèmes de recommandation sans données

Selon la distribution Zipf, on peut obtenir la formule suivante :

Décomposition matricielle de Poisson : un algorithme de décomposition matricielle qui résout le problème de démarrage à froid des systèmes de recommandation sans données

Sur la base de la formule ci-dessus, nous obtenons la forme analytique de décomposition matricielle de Poisson (PoissonMat) :

Décomposition matricielle de Poisson : un algorithme de décomposition matricielle qui résout le problème de démarrage à froid des systèmes de recommandation sans données

En utilisant l'algorithme de descente de gradient stochastique pour résoudre la formule ci-dessus, nous obtenons la flux d'algorithme suivant :

Décomposition matricielle de Poisson : un algorithme de décomposition matricielle qui résout le problème de démarrage à froid des systèmes de recommandation sans données

L'auteur a ensuite mené une comparaison expérimentale de la précision et de l'équité de l'algorithme sur l'ensemble de données MovieLens 1 Million et l'ensemble de données LDOS-CoMoDa :

Décomposition matricielle de Poisson : un algorithme de décomposition matricielle qui résout le problème de démarrage à froid des systèmes de recommandation sans données

Décomposition matricielle de Poisson : un algorithme de décomposition matricielle qui résout le problème de démarrage à froid des systèmes de recommandation sans données

Figure 1 Matrice de Poisson décomposition dans MovieLens 1 Million Dataset Expérience comparative sur

Décomposition matricielle de Poisson : un algorithme de décomposition matricielle qui résout le problème de démarrage à froid des systèmes de recommandation sans données

Décomposition matricielle de Poisson : un algorithme de décomposition matricielle qui résout le problème de démarrage à froid des systèmes de recommandation sans données

Figure 2 Expérience comparative de décomposition matricielle de Poisson sur l'ensemble de données LDOS-CoMoDa

Sur la base des résultats de la comparaison expérimentale, nous pouvons tirer les conclusions suivantes : La décomposition matricielle de Poisson (PoissonMat) a de meilleures performances en termes de précision et d'équité les indicateurs sont meilleurs que les autres algorithmes. Et ce qui est louable, c'est que l'algorithme de décomposition matricielle de Poisson n'utilise aucune donnée d'entrée. Il s'agit d'un algorithme d'apprentissage complet à échantillon nul, qui résout très bien le problème du démarrage à froid.

Enfin, l'auteur a mené l'expérience sur un ordinateur portable Lenovo avec 16 Go de RAM et Intel Core i5. L'algorithme s'exécute très rapidement et la mise en œuvre est très simple.

L'algorithme d'apprentissage zéro-shot, qui vise à résoudre le problème du démarrage à froid des systèmes de recommandation, est actuellement un point chaud de la recherche. Un véritable algorithme d'apprentissage zéro-shot qui ne nécessite aucune donnée pour résoudre les problèmes d'apprentissage zéro-shot, à partir de l'algorithme ZeroMat en 2021. L'algorithme de décomposition matricielle de Poisson (PoissonMat) présenté dans cet article a de meilleures performances que ZeroMat et son algorithme ultérieur DotMat, et est actuellement l'un des meilleurs algorithmes dans ce domaine. Étant donné que la recherche pertinente en est encore à ses balbutiements, nous espérons qu’elle attirera l’attention et l’attention de la majorité des praticiens de la science et de la technologie.

Présentation de l'auteur

Wang Hao, ancien chef du laboratoire d'intelligence artificielle Funplus, ancien chef du département Big Data de Hengchang Litong. Diplômé de l'Université de l'Utah aux États-Unis avec un baccalauréat (2008) et un master (2010). MBA à temps partiel de l'Université de commerce international et d'économie (2016). Dans les systèmes de recommandation (équité/recommandation basée sur des scénarios/démarrage à froid/interprétabilité/apprentissage par classement), infographie (modélisation/visualisation géométrique), traitement du langage naturel (applications de mise en œuvre dans l'industrie), contrôle des risques et anti-fraude (Finance/médical) et d'autres directions avec de nombreuses années d'expérience et des idées uniques. Il possède 12 ans d'expérience en R&D technologique et en gestion dans Internet (Douban, Baidu, Sina, NetEase, etc.), dans la technologie financière (Hengchang Litong) et dans les sociétés de jeux (Funplus, etc.). A publié 30 articles dans des conférences et revues universitaires internationales et a remporté 3 prix du meilleur article/prix du meilleur rapport de conférence internationale (Prix du meilleur article IEEE SMI 2008/Prix de la meilleure présentation orale ICBDT 2020/Prix de la meilleure présentation orale ICISCAE 2021). Médaille d'or de la compétition régionale nord-américaine des Rocheuses de l'ACM/ICPC 2006. 2004 Médaille de bronze à la finale d'expression orale du National College English Proficiency Competition. En 2003, il a remporté la première place en anglais en sciences et ingénierie à l'examen d'entrée au Jinan College.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer