Maison >Périphériques technologiques >IA >L'Université Tsinghua a remporté le prix du meilleur article + test de temps, l'Université du Shandong a reçu une mention honorable et les prix SIGIR 2024 ont été annoncés

L'Université Tsinghua a remporté le prix du meilleur article + test de temps, l'Université du Shandong a reçu une mention honorable et les prix SIGIR 2024 ont été annoncés

王林
王林original
2024-07-19 00:06:43567parcourir

L'Université Tsinghua a des résultats exceptionnels.


La 47e conférence de l'Association for Computing Machinery sur la recherche d'informations (ACM SIGIR) se tiendra à Washington, DC, États-Unis, du 14 au 18 juillet 2024. Cette conférence est la plus grande conférence académique dans le domaine de la recherche d'informations.

Tout à l'heure, la conférence a annoncé le prix du meilleur article, le prix du meilleur article, le prix de la mention honorable du meilleur article et le prix Time Test.

Parmi eux, l'Université Tsinghua, la Hillhouse School of Artificial Intelligence de l'Université Renmin de Chine et l'équipe Xiaohongshu ont remporté le meilleur article ; des chercheurs de l'Université de Glasgow et de l'Université de Pise ont remporté la deuxième place ; le prix de mention du meilleur article a été décerné à des chercheurs de l'Université de Shandong (Qingdao), de l'Université de Leiden et de l'Université d'Amsterdam ; le Time Test Award a été décerné à des chercheurs de l'Université de Tsinghua et de l'Université de Californie à Santa Cruz.

Ensuite, regardons le contenu spécifique de l'article gagnant. "Meilleur article" , Jia Chen, Liu Yiqun

Institutions : Université Tsinghua, Hillhouse School of Artificial Intelligence, Renmin University of China, Xiaohongshu
Lien papier : https://dl.acm.org/doi/abs/10.1145/3626772.3657743
清华包揽最佳论文+时间检验奖,山大获荣誉提名,SIGIR 2024奖项出炉
  • À propos de l'article
     : Les chercheurs ont observé des lois de mise à l'échelle dans un large éventail de tâches, en particulier la génération de langage. La recherche montre que les performances des grands modèles de langage suivent des modèles prévisibles selon la taille des modèles et des ensembles de données, ce qui aide à concevoir des stratégies de formation efficaces et efficientes, d'autant plus que la formation à grande échelle devient de plus en plus gourmande en ressources. Cependant, en recherche dense, la loi d’expansion n’a pas été pleinement explorée.
  • Cette étude explore comment la mise à l'échelle affecte les performances des modèles de récupération dense. Plus précisément, l’équipe de recherche a mis en œuvre des modèles de récupération denses avec différents nombres de paramètres et les a formés à l’aide de différentes quantités de données annotées. Cette étude utilise l'entropie contrastive comme mesure d'évaluation Par rapport aux mesures de classement discrètes, l'entropie contrastive est continue et peut donc refléter avec précision les performances du modèle.
  • Les résultats expérimentaux montrent que les performances des modèles de récupération dense suivent une mise à l'échelle exacte de la loi de puissance liée à la taille du modèle et au nombre d'annotations.

De plus, l'étude montre également que la loi d'expansion permet d'optimiser le processus de formation, comme par exemple résoudre les problèmes d'allocation des ressources sous contraintes budgétaires.

Cette étude contribue grandement à la compréhension des effets d'échelle des modèles de récupération dense et fournit des orientations significatives pour les recherches futures.
清华包揽最佳论文+时间检验奖,山大获荣誉提名,SIGIR 2024奖项出炉
Le finaliste du meilleur article清华包揽最佳论文+时间检验奖,山大获荣誉提名,SIGIR 2024奖项出炉
清华包揽最佳论文+时间检验奖,山大获荣誉提名,SIGIR 2024奖项出炉
Le finaliste du meilleur article de l'ACM SIGIR de cette année a été décerné à l'article "A Reproductibility Study of PLAID". Les auteurs de l'article sont Sean MacAvaney de l'Université de Glasgow et Nicola Tonellotto de l'Université de Pise. 清华包揽最佳论文+时间检验奖,山大获荣誉提名,SIGIR 2024奖项出炉
Adresse du papier : https://arxiv.org/pdf/2404.14989

Résumé du papier : L'algorithme PLAID de ColBERTv2 utilise des représentations de termes groupés pour récupérer et élaguer progressivement les documents afin d'obtenir une note finale pour le document. Cet article reproduit et comble les lacunes manquantes du texte original. En étudiant les paramètres introduits par PLAID, les chercheurs ont découvert que sa frontière de Pareto est formée par l'équilibre entre trois paramètres. Un écart par rapport aux paramètres recommandés peut augmenter considérablement la latence sans nécessairement améliorer son efficacité.

Sur la base de cette découverte, cet article compare PLAID à une base de référence importante absente de l'article : la réorganisation du système lexical. Il s’avère que l’application de ColBERTv2 en tant que réorganisateur au-dessus du pool de résultats initial du BM25 offre un meilleur compromis efficacité-efficacité dans les paramètres à faible latence. Ce travail met en évidence l’importance d’une sélection minutieuse de lignes de base pertinentes lors de l’évaluation de l’efficacité du moteur de récupération.

Prix de mention honorable pour le meilleur article

Le prix de mention honorable pour le meilleur article de cette conférence a été remporté par des chercheurs de l'Université de Shandong (Qingdao), de l'Université de Leiden et de l'Université d'Amsterdam. L'article gagnant est "Generative Retrieval as Multi-Vector Dense Retrieval".
清华包揽最佳论文+时间检验奖,山大获荣誉提名,SIGIR 2024奖项出炉
  • Auteurs de l'article : Wu Shiguang, Wei Wenda, Zhang Mengqi, Chen Zhumin, Ma Jun, Ren Zhaochun, Maarten de Rijke, Ren Pengjie
  • Adresse de l'article : https://arxiv.org /pdf/2404.00684

Résumé : Cet article mesure la pertinence des requêtes de documents en démontrant que la récupération générative et la récupération dense multi-vecteurs partagent le même cadre. Plus précisément, ils ont étudié la couche d’attention et la tête de prédiction de la récupération générative, révélant que la récupération générative peut être comprise comme un cas particulier de récupération dense multi-vecteurs. Les deux méthodes calculent la corrélation en calculant la somme des produits du vecteur de requête et du vecteur de document avec la matrice d'alignement.

Ensuite, les chercheurs ont exploré comment appliquer ce cadre à la récupération générative, et ils ont adopté différentes stratégies pour calculer les vecteurs de jetons de document et les matrices d'alignement. Des expériences sont menées pour vérifier les conclusions, montrant que les deux paradigmes présentent des points communs en termes d'appariement de termes dans leurs matrices d'alignement.

Prix éprouvé par le temps

Le prix ACM SIGIR Time-tested de cette année a été décerné à la recherche sur la recommandation explicable publiée au SIGIR 2014 il y a 10 ans, l'article s'intitule "Modèles à facteurs explicites pour une recommandation explicable "basé sur l'analyse des sentiments au niveau de la phrase".
清华包揽最佳论文+时间检验奖,山大获荣誉提名,SIGIR 2024奖项出炉
  • Auteurs de l'article : Zhang Yongfeng, Lai Guoquan, Zhang Min, Yi Zhang, Liu Yiqun, Ma Shaoping
  • Institution : Université Tsinghua, Université de Californie, Santa Cruz
  • Lien vers l'article : https://www.cs.cmu.edu/~glai1/papers/yongfeng-guokun-sigir14.pdf

Cette étude définit pour la première fois le problème de la « recommandation interprétable » et propose le sentiment correspondant méthodes d'analyse pour Pour résoudre ce défi technique, il a joué un rôle de premier plan dans des domaines connexes.

Paper abstract : Les algorithmes de recommandation basés sur le filtrage collaboratif (CF), tels que les modèles à facteurs latents (LFM), fonctionnent bien en termes de précision de prédiction. Cependant, les caractéristiques sous-jacentes rendent difficile l’explication des résultats des recommandations aux utilisateurs.

Heureusement, à mesure que les avis des utilisateurs en ligne continuent de croître, les informations disponibles pour les systèmes de recommandation de formation ne se limitent plus aux notes numériques par étoiles ou aux caractéristiques des utilisateurs/éléments. En extrayant les opinions explicites des utilisateurs sur divers aspects d'un produit à partir des avis, il est possible d'acquérir une compréhension plus détaillée de ce qui intéresse les utilisateurs, ce qui révèle en outre la possibilité de formuler des recommandations explicables.

Cet article propose l'EFM (Explicit Factor Model) pour générer des recommandations interprétables tout en conservant une grande précision de prédiction.

Les chercheurs extraient d'abord les caractéristiques explicites du produit et les opinions des utilisateurs en effectuant une analyse des sentiments au niveau des phrases sur les avis des utilisateurs, puis génèrent des recommandations et des non-recommandations basées sur les caractéristiques spécifiques du produit qui intéressent les utilisateurs et les fonctionnalités latentes apprises. De plus, des explications intuitives au niveau des fonctionnalités expliquant pourquoi un élément est recommandé ou non sont générées à partir du modèle.

Les résultats expérimentaux hors ligne sur plusieurs ensembles de données du monde réel montrent que le cadre proposé dans cette étude surpasse les algorithmes de base concurrents sur les tâches de prédiction de notation et de recommandation top-K. Les expériences en ligne montrent que les explications détaillées rendent les recommandations et non-recommandations plus influentes sur le comportement d’achat des utilisateurs.

Prix pour jeunes chercheurs

Le prix ACM SIGIR pour jeunes chercheurs vise à reconnaître les chercheurs qui ont joué un rôle important dans la recherche en recherche d'informations, dans la création d'une communauté universitaire et dans la promotion de l'équité académique. obtenir un doctorat 7 Jeunes chercheurs d'ici 20 ans. Ai Qingyao, professeur adjoint du Département d'informatique de l'Université Tsinghua, et Wang Xiang, professeur et directeur de doctorat de l'École de sécurité du cyberespace et de Big Data de l'Université des sciences et technologies de Chine, ont remporté le prix SIGIR 2024 Young. Prix ​​d'érudit.

Ai Qingyao

Ai Qingyao est professeur adjoint au département d'informatique de l'université Tsinghua. Ses principaux domaines de recherche se concentrent sur la recherche d'informations, l'apprentissage automatique et le traitement du langage naturel. L'orientation principale de la recherche est la recherche et la conception de systèmes intelligents de recherche d'informations, y compris l'apprentissage de la représentation de l'information, la théorie de l'optimisation du classement et l'application de grands modèles de langage dans la recherche et la recommandation sur Internet et la justice intelligente.

Wang Xiang

Wang Xiang est professeur et directeur de doctorat à l'École de sécurité du cyberespace et de Big Data de l'Université des sciences et technologies de Chine. Les intérêts de recherche du professeur Wang Xiang comprennent la récupération d’informations, l’exploration de données et l’intelligence artificielle fiable et explicable, en particulier les systèmes de recommandation, l’apprentissage de graphiques et l’analyse des médias sociaux.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn