Maison >Périphériques technologiques >IA >Apprenez bien l'algèbre linéaire et jouez avec les systèmes de recommandation
Auteur | Wang Hao
Chonglou
En parlant de 21 La technologie Internet du siècle, sauf Python/Rust/Go Attendez une minute La naissance d'une série de nouveaux langages de programmation et le développement vigoureux des technologies de recherche d'informations sont également un point culminant. Le premier modèle commercial purement technologique sur Internet était la technologie des moteurs de recherche représentée par Google et Baidu. Cependant, ce à quoi tout le monde ne s’attend pas, c’est que le système de recommandation est né il y a longtemps. Dès 1992 , le premier système de recommandation de l'histoire de l'humanité a été publié sous la forme d'un article. À cette époque, Google et Baidu n'étaient pas encore nés.
n'est pas considéré comme une nécessité rigide comme les moteurs de recherche, et de nombreuses licornes sont rapidement nées. Les entreprises technologiques ayant des systèmes de recommandation comme technologie de base n'apparaîtront qu'avec la montée en puissance de Toutiao et Douyin à l'ère 2010 . Il ne fait aucun doute que Toutiao et Douyin sont devenues les entreprises représentatives les plus performantes dans les systèmes de recommandation. Si le moteur de recherche de technologie de recherche d'informations de première génération a été préempté par les Américains, alors le système de recommandation de technologie de recherche d'informations de deuxième génération est fermement contrôlé par les Chinois. Et nous rencontrons maintenant la troisième génération de technologie de recherche d'informations —— recherche d'informations basée sur de grands modèles de langage. À l’heure actuelle, les premiers acteurs sont les pays européens et américains, mais la Chine et les États-Unis avancent actuellement ensemble.
Ces dernières années, la conférence faisant autorité dans le domaine des systèmes de recommandation RecSys a fréquemment décerné le prix du meilleur article à Sequential Recommendation (Sequential Recommendation). Cela montre que ce domaine accorde de plus en plus d’attention aux applications verticales. Il existe une application verticale du système de recommandation qui est si importante, mais elle n'a pas fait d'énormes vagues jusqu'à présent. Ce domaine est la recommandation basée sur des scénarios (Context-aware Recommendation), appelée CARS. Nous voyons occasionnellement des WORKSHOP de CARS , mais ces Workshop ne produisent pas plus de 10 papiers chaque année, ce qui est une poignée.
VOITURES A quoi peut-il servir ? Tout d'abord, CARS est déjà utilisé par des entreprises de restauration rapide comme Burger King. Il peut également recommander de la musique aux utilisateurs en fonction de la scène pendant la conduite de la voiture. De plus, on peut y réfléchir, est-il possible pour nous de recommander des plans de voyage aux utilisateurs en fonction des conditions météorologiques ? Ou recommander des repas aux utilisateurs en fonction de leur condition physique ? En fait, tant que nous laissons libre cours à notre imagination, nous pouvons toujours trouver différentes applications pratiques pour CARS .
Cependant, la question se pose, puisque CARS est si largement utilisé, pourquoi si peu de gens publient des articles ? La raison est simple, car il n'existe presque aucun ensemble de données publiques disponible pour CARS . Actuellement, le meilleur ensemble de données publiques de CARS est l'ensemble de données LDOS-CoMoDa de Slovénie. En dehors de cela, il est difficile de trouver d’autres ensembles de données. LDOS-CoMoDa fournit des données sur la scène des utilisateurs lorsqu'ils regardent des films sous forme d'enquêtes, permettant ainsi aux chercheurs de s'engager dans des recherches CARS . Le moment où les données doivent être divulguées se situe entre 2012 et 2013 , mais actuellement, très peu de gens connaissent cette collecte de données.
Retour aux affaires, cet article présente principalement l'algorithme MatMat / MovieMat et l'algorithme PowerMat . Ces algorithmes sont des outils puissants pour résoudre le problème des CARS . Voyons d'abord comment MatMat définit le problème CARS : Nous redéfinissons d'abord la matrice d'évaluation des utilisateurs, et nous remplaçons chaque valeur de notation de la matrice d'évaluation des utilisateurs par une matrice carrée. Les éléments diagonaux de la matrice carrée sont les valeurs de score d'origine et les éléments hors diagonale sont des informations sur la scène.
Nous définissons ci-dessous la fonction de perte de l'algorithme MatMat , qui modifie la fonction de perte de décomposition matricielle classique et a la forme suivante :
où U et V sont toutes deux des matrices. De cette façon, nous modifions le produit scalaire vectoriel dans la factorisation matricielle d’origine. Transformez la multiplication de points vectoriels en multiplication matricielle. Prenons l'exemple suivant :
Nous avons effectué une expérience de comparaison des performances sur MovieLens Small Dataset et avons obtenu les résultats suivants :
Comme vous pouvez le voir, MatMat L'effet de l'algorithme est meilleur que l'algorithme de décomposition matricielle classique. Vérifions à nouveau l'équité du système de recommandation :
On constate que MatMat fonctionne toujours bien en termes d'indicateurs d'équité. Le processus de résolution de MatMat est relativement compliqué. Même l'auteur qui a inventé l'algorithme n'a pas écrit le processus de dérivation dans l'article. Mais comme le dit le proverbe, si vous apprenez bien l’algèbre linéaire, vous n’aurez pas peur de voyager partout dans le monde. Je pense que les lecteurs intelligents seront capables de dériver les formules pertinentes et de mettre en œuvre cet algorithme. MatMat L'adresse originale de l'article sur l'algorithme se trouve au lien suivant : https://www.php.cn/link/9b8c60725a0193e78368bf8b84c37fb2 . Cet article est le prix du meilleur rapport papier de la Conférence académique internationale IEEE ICISCAE 2021 . L'algorithme
MatMat est appliqué dans le domaine de la recommandation de films basée sur des scènes. L'instance de film de cet algorithme est nommée MovieMat. La matrice de notation de MovieMat est définie comme suit :
L'auteur a ensuite mené une expérience comparative :
sur le LDOS-CoMoDa ensemble de données, MovieMat atteint des performances bien supérieures à celles de la décomposition matricielle classique. Jetons un coup d'œil aux résultats de l'évaluation de l'équité :
En termes d'équité, la décomposition matricielle classique a obtenu de meilleurs résultats que MovieMat . L'article original de MovieMat peut être trouvé sur le lien suivant : https://www.php.cn/link/f4ec6380c50a68a7c35d109bec48aebf .
Nous rencontrons parfois de tels problèmes. Que devons-nous faire lorsque nous arrivons à un nouvel emplacement et que nous disposons uniquement de données de scène mais pas de données d'évaluation des utilisateurs ? Peu importe, Ratidar Technologies LLC (Beijing Daping Qizhi Network Technology Co., Ltd. ) a inventé l'algorithme CARS basé sur l'apprentissage zéro tir - PowerMat. L'article original de PowerMat peut être trouvé sur le lien suivant : https://www.php.cn/link/1514f187930072575629709336826443 . L'inventeur de
PowerMat a emprunté MAP et DotMat et a défini la fonction MAP suivante : où
U
est l'utilisateur Le vecteur de caractéristiques,V est le vecteur de caractéristiques de l'élément, R est la valeur d'évaluation de l'utilisateur et C est la variable de scène. Concrètement, on obtient la formule suivante :
En utilisant la descente de gradient stochastique pour résoudre ce problème, nous obtenons la formule suivante : Grâce à l'observation, nous avons constaté qu'il n'y a pas de variables liées aux données d'entrée dans cet ensemble de formules, donc PowerMat est un algorithme d'apprentissage zéro-shot lié uniquement aux scénarios. Cet algorithme peut être appliqué dans les scénarios suivants : les touristes prévoient de se rendre à un certain endroit, mais n'y sont jamais allés, ils ne disposent donc que de données de scène telles que la météo. Nous pouvons utiliser PowerMat pour recommander des attractions à enregistrer. touristes, etc Voici les données de comparaison entre PowerMat et d'autres algorithmes : À travers cette image, nous trouvons PowerMat et MovieMat flag Les tambours sont calmes, non Ils sont comparables, et les résultats sont meilleurs que l'algorithme de décomposition matricielle classique. L'image ci-dessous montre que même en termes d'équité index , PowerMat fonctionne toujours très bien : Grâce à des expériences comparatives, nous avons constaté que PowerMat est excellent VOITURES algorithme. Les ingénieurs de données Internet disent souvent que les données sont avant tout. Et autour de l’ère 2010 , il y avait une forte tendance sur Internet qui était haussière sur les données et baissière sur les algorithmes. CARS en est un excellent exemple. Parce que la grande majorité des gens n’ont pas accès aux données pertinentes, le développement de ce domaine a été considérablement restreint. Grâce aux chercheurs slovènes qui ont rendu publique la collecte de données LDOS-CoMoDa , nous avons l'opportunité de développer ce domaine. Nous espérons également que de plus en plus de gens s'intéressent aux voitures, à l'atterrissage des voitures et au financement des voitures ...
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!