Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  Die Tsinghua-Universität gewann den Best Paper + Time Test Award, die Shandong-Universität erhielt eine lobende Erwähnung und die SIGIR 2024-Auszeichnungen wurden bekannt gegeben

Die Tsinghua-Universität gewann den Best Paper + Time Test Award, die Shandong-Universität erhielt eine lobende Erwähnung und die SIGIR 2024-Auszeichnungen wurden bekannt gegeben

王林
王林Original
2024-07-19 00:06:43429Durchsuche

Die Tsinghua-Universität hat hervorragende Ergebnisse erzielt.


Die 47. Association for Computing Machinery Conference on Information Retrieval (ACM SIGIR) findet vom 14. bis 18. Juli 2024 in Washington, DC, USA statt. Diese Konferenz ist die wichtigste akademische Konferenz im Bereich Information Retrieval.

Soeben hat die Konferenz den Best Paper Award, den Best Paper Runner-up, den Best Paper Honourable Mention Award und den Time Test Award bekannt gegeben.

Unter ihnen gewannen die Tsinghua University, die Hillhouse School of Artificial Intelligence an der Renmin University of China und das Xiaohongshu-Team den zweiten Platz; Der Erwähnungspreis für die beste Arbeit ging an Forscher der Shandong-Universität (Qingdao), der Universität Leiden und der Time Test Award an Forscher der Tsinghua-Universität und der University of California, Santa Cruz.

Als nächstes schauen wir uns den konkreten Inhalt des Gewinnerpapiers an.

Bester Artikel
清华包揽最佳论文+时间检验奖,山大获荣誉提名,SIGIR 2024奖项出炉
  • Artikel: Scaling Laws For Dense Retrieval
  • Autoren des Artikels: Fang Yan, Jingtao Zhan, Ai Qingyao, Mao Ji Axin, Weihang Su, Jia Chen, Liu Yiqun
  • Institutionen: Tsinghua University, Hillhouse School of Artificial Intelligence, Renmin University of China, Xiaohongshu
  • Link zum Papier: https://dl.acm.org/doi/abs/10.1145/3626772.3657743

Über den Artikel: Forscher haben Skalierungsgesetze bei einer Vielzahl von Aufgaben beobachtet, insbesondere bei der Sprachgenerierung. Untersuchungen zeigen, dass die Leistung großer Sprachmodelle über alle Modell- und Datensatzgrößen hinweg vorhersehbaren Mustern folgt, was bei der effektiven und effizienten Gestaltung von Trainingsstrategien hilft, insbesondere da groß angelegte Schulungen immer ressourcenintensiver werden. Beim Dense Retrieval ist das Expansionsgesetz jedoch noch nicht vollständig erforscht.

Diese Studie untersucht, wie sich die Skalierung auf die Leistung dichter Retrieval-Modelle auswirkt. Konkret implementierte das Forschungsteam dichte Retrieval-Modelle mit unterschiedlicher Anzahl von Parametern und trainierte sie mit unterschiedlichen Mengen annotierter Daten. Diese Studie verwendet die kontrastive Entropie als Bewertungsmetrik. Im Vergleich zu diskreten Ranking-Metriken ist die kontrastive Entropie kontinuierlich und kann daher die Leistung des Modells genau widerspiegeln.
清华包揽最佳论文+时间检验奖,山大获荣誉提名,SIGIR 2024奖项出炉
Experimentelle Ergebnisse zeigen, dass die Leistung dichter Retrieval-Modelle einer exakten Potenzgesetz-Skalierung in Bezug auf die Modellgröße und die Anzahl der Anmerkungen folgt.
清华包揽最佳论文+时间检验奖,山大获荣誉提名,SIGIR 2024奖项出炉
清华包揽最佳论文+时间检验奖,山大获荣誉提名,SIGIR 2024奖项出炉
清华包揽最佳论文+时间检验奖,山大获荣誉提名,SIGIR 2024奖项出炉
Darüber hinaus zeigt die Studie auch, dass das Expansionsgesetz dazu beiträgt, den Trainingsprozess zu optimieren, beispielsweise bei der Lösung von Ressourcenallokationsproblemen unter Budgetbeschränkungen.
清华包揽最佳论文+时间检验奖,山大获荣誉提名,SIGIR 2024奖项出炉
Diese Studie trägt wesentlich zum Verständnis der Skalierungseffekte von Dense-Retrieval-Modellen bei und bietet sinnvolle Leitlinien für zukünftige Forschung.

Der Zweitplatzierte für das beste Papier

Der Zweitplatzierte für das beste Papier beim diesjährigen ACM SIGIR wurde an das Papier „A Reproducibility Study of PLAID“ vergeben. Zu den Autoren des Papiers gehören Sean MacAvaney von der University of Glasgow und Nicola Tonellotto von der University of Pisa.

清华包揽最佳论文+时间检验奖,山大获荣誉提名,SIGIR 2024奖项出炉

Papieradresse: https://arxiv.org/pdf/2404.14989

Papierzusammenfassung: Der PLAID-Algorithmus von ColBERTv2 verwendet geclusterte Begriffsdarstellungen, um Dokumente abzurufen und schrittweise zu bereinigen, um eine endgültige Dokumentbewertung zu erhalten. Dieser Artikel gibt die fehlenden Lücken im Originaltext wieder und füllt ihn. Durch die Untersuchung der von PLAID eingeführten Parameter stellten die Forscher fest, dass die Pareto-Grenze durch das Gleichgewicht zwischen drei Parametern gebildet wird. Eine Abweichung von den empfohlenen Einstellungen kann die Latenz erheblich erhöhen, ohne dass sich dadurch zwangsläufig die Wirksamkeit verbessert.

Basierend auf dieser Erkenntnis vergleicht dieser Artikel PLAID mit einer wichtigen Grundlinie, die im Artikel fehlt: der Neuordnung des lexikalischen Systems. Es wurde festgestellt, dass die Anwendung von ColBERTv2 als Reorderer zusätzlich zum anfänglichen BM25-Ergebnispool einen besseren Kompromiss zwischen Effizienz und Effektivität in Einstellungen mit geringer Latenz bietet. Diese Arbeit unterstreicht die Bedeutung einer sorgfältigen Auswahl relevanter Basislinien bei der Bewertung der Effizienz von Retrieval-Engines.

Honorable Mention Award für das beste Paper

Der Honorable Mention Award für das beste Paper auf dieser Konferenz wurde von Forschern der Shandong University (Qingdao), der Leiden University und der University of Amsterdam gewonnen. Der Gewinnerbeitrag ist „Generative Retrieval as Multi-Vector Dense Retrieval“.
清华包揽最佳论文+时间检验奖,山大获荣誉提名,SIGIR 2024奖项出炉
  • Autoren des Artikels: Wu Shiguang, Wei Wenda, Zhang Mengqi, Chen Zhumin, Ma Jun, Ren Zhaochun, Maarten de Rijke, Ren Pengjie
  • Adresse des Artikels: https://arxiv.org /pdf/2404.00684

Zusammenfassung: Dieses Papier misst die Relevanz von Dokumentabfragen, indem es zeigt, dass generatives Retrieval und Multi-Vektor-Dense-Retrieval dasselbe Framework verwenden. Insbesondere untersuchten sie die Aufmerksamkeitsschicht und den Vorhersagekopf des generativen Abrufs und zeigten, dass generativer Abruf als Sonderfall des dichten Multi-Vektor-Abrufs verstanden werden kann. Beide Methoden berechnen die Korrelation, indem sie die Summe der Produkte des Abfragevektors und des Dokumentvektors mit der Ausrichtungsmatrix berechnen.

Dann untersuchten die Forscher, wie sich dieses Framework auf den generativen Abruf anwenden lässt, und übernahmen verschiedene Strategien zur Berechnung von Dokument-Token-Vektoren und Ausrichtungsmatrizen. Zur Überprüfung der Schlussfolgerungen werden Experimente durchgeführt, die zeigen, dass beide Paradigmen Gemeinsamkeiten bei der Termübereinstimmung in ihren Ausrichtungsmatrizen aufweisen.

Time-tested Award

Der diesjährige ACM SIGIR Time-tested Award wurde an die Forschung zu erklärbaren Empfehlungen verliehen, die vor 10 Jahren auf der SIGIR 2014 veröffentlicht wurde. Der Artikel trägt den Titel „Explicit Factor Models for Explainable Recommendation“. „Basierend auf einer Stimmungsanalyse auf Phrasenebene“.
清华包揽最佳论文+时间检验奖,山大获荣誉提名,SIGIR 2024奖项出炉
  • Autoren des Papiers: Zhang Yongfeng, Lai Guoquan, Zhang Min, Yi Zhang, Liu Yiqun, Ma Shaoping
  • Institution: Tsinghua University, University of California, Santa Cruz
  • Link zum Papier : https://www.cs.cmu.edu/~glai1/papers/yongfeng-guokun-sigir14.pdf

Diese Studie definiert erstmals das Problem der „interpretierbaren Empfehlung“ und schlägt eine entsprechende Stimmung vor Analysemethoden zur Lösung dieser technischen Herausforderung spielen in verwandten Bereichen eine führende Rolle.

Papierzusammenfassung: Empfehlungsalgorithmen, die auf kollaborativer Filterung (CF) basieren, wie z. B. latente Faktormodelle (LFM), schneiden hinsichtlich der Vorhersagegenauigkeit gut ab. Aufgrund der zugrunde liegenden Merkmale ist es jedoch schwierig, den Nutzern die Empfehlungsergebnisse zu erklären.

Glücklicherweise sind die für Trainingsempfehlungssysteme verfügbaren Informationen nicht mehr auf numerische Sternebewertungen oder Benutzer-/Artikelmerkmale beschränkt, da Online-Benutzerbewertungen weiter zunehmen. Durch das Extrahieren der expliziten Meinungen der Benutzer zu verschiedenen Aspekten eines Produkts aus Bewertungen ist es möglich, ein detaillierteres Verständnis dafür zu gewinnen, was den Benutzern wichtig ist, was die Möglichkeit eröffnet, erklärbare Empfehlungen abzugeben.

Dieser Artikel schlägt EFM (Explicit Factor Model) vor, um interpretierbare Empfehlungen zu generieren und gleichzeitig eine hohe Vorhersagegenauigkeit aufrechtzuerhalten.

Forscher extrahieren zunächst explizite Produktmerkmale und Benutzermeinungen, indem sie eine Sentimentanalyse auf Phrasenebene an Benutzerbewertungen durchführen, und generieren dann Empfehlungen und Nicht-Empfehlungen auf der Grundlage spezifischer Produktmerkmale, die für Benutzer von Interesse sind, und erlernter latenter Merkmale. Darüber hinaus werden aus dem Modell intuitive Erklärungen auf Funktionsebene generiert, warum ein Artikel empfohlen oder nicht empfohlen wird.

Offline-experimentelle Ergebnisse an mehreren realen Datensätzen zeigen, dass das in dieser Studie vorgeschlagene Framework konkurrierende Basisalgorithmen sowohl bei Bewertungsvorhersage- als auch bei Top-K-Empfehlungsaufgaben übertrifft. Online-Experimente zeigen, dass Empfehlungen und Nicht-Empfehlungen durch ausführliche Erläuterungen einen größeren Einfluss auf das Kaufverhalten der Nutzer haben.

Young Scholar Award

Der ACM SIGIR Young Scholar Award zielt darauf ab, Forscher zu würdigen, die eine wichtige Rolle bei der Informationsbeschaffungsforschung, dem Aufbau von Wissenschaftlergemeinschaften und der Förderung akademischer Gerechtigkeit gespielt haben 7 Nachwuchswissenschaftler innerhalb von 20 Jahren promovieren. Ai Qingyao, Assistenzprofessor am Institut für Informatik der Tsinghua-Universität, und Wang Xiang, Professor und Doktorvater an der School of Cyberspace Security und der Big Data School der University of Science and Technology of China, gewannen den SIGIR 2024 Young Gelehrtenpreis.

Ai Qingyao

Ai Qingyao ist Assistenzprofessor am Institut für Informatik der Tsinghua-Universität. Seine Forschungsschwerpunkte liegen auf der Informationsbeschaffung, dem maschinellen Lernen und der Forschung zur Verarbeitung natürlicher Sprache. Die wichtigste Forschungsrichtung ist die Erforschung und Gestaltung intelligenter Informationsabrufsysteme, einschließlich des Lernens der Informationsdarstellung, der Ranking-Optimierungstheorie und der Anwendung großer Sprachmodelle bei der Internetsuche und -empfehlung sowie der intelligenten Gerechtigkeit.

Wang Xiang

Wang Xiang ist Professor und Doktorvater an der School of Cyberspace Security and Big Data School der University of Science and Technology of China. Zu den Forschungsinteressen von Professor Wang Xiang gehören Information Retrieval, Data Mining sowie vertrauenswürdige und erklärbare künstliche Intelligenz, insbesondere Empfehlungssysteme, Graph Learning und Social-Media-Analyse.

Das obige ist der detaillierte Inhalt vonDie Tsinghua-Universität gewann den Best Paper + Time Test Award, die Shandong-Universität erhielt eine lobende Erwähnung und die SIGIR 2024-Auszeichnungen wurden bekannt gegeben. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn