Maison > Article > Périphériques technologiques > L'Alibaba DAMO Academy remporte le meilleur article de SemEval pour aider l'IA à mieux comprendre le langage humain
Selon les informations du 19 juillet, SemEval-2022, le plus grand concours d'évaluation sémantique au monde, a récemment annoncé que le seul « Best System Paper Award » de cette année serait décerné à des chercheurs de l'Alibaba Damo Academy et d'autres institutions. Ils ont conçu un système de reconnaissance d'entités nommées (NER) qui intègre des connaissances dans 11 langues, dont le chinois et l'anglais. Il peut identifier avec précision les informations clés sur les entités telles que les noms de personnes, les noms de lieux, les institutions, les œuvres, etc., ce qui améliore efficacement la compréhension de l'IA. capacité du langage humain.
SemEval (Semantic Evaluation) est un concours international faisant autorité dans le domaine du traitement du langage naturel avec plus de 20 ans d'histoire. Il est hébergé par le Groupe Lexique et Sémantique de l'Association Internationale de Linguistique Informatique (ACL) et vise à permettre. L'IA pour analyser et comprendre le sens inscrit dans le langage humain.
SemEval a deux prix du meilleur article : le prix du meilleur article de tâche et le prix du meilleur article système. La compréhension populaire est que l’une consiste à poser des questions et l’autre à résoudre des problèmes. L'équipe de recherche conjointe de l'Alibaba DAMO Academy, de l'Université des sciences et technologies de Shanghai, de l'Université du Zhejiang et de l'Université de technologie et de design de Singapour a remporté le prix du meilleur article sur le système de cette année. L'article qui s'est démarqué parmi 221 articles candidats s'intitule « DAMO-NLP à. SemEval- 2022 Tâche 11 : Un système basé sur les connaissances pour la reconnaissance d'entités nommées multilingues》.
SemEval-2022 Meilleur article sur le système
L'équipe gagnante a participé à l'une des 12 tâches de SemEval-2022 : Reconnaissance d'entités nommées complexes multilingues. La reconnaissance d'entités nommées (NER) est un travail de base dans le domaine du traitement du langage naturel. Elle fait référence à l'identification de mots d'entités (Entités) ayant des significations spécifiques dans le texte, comprenant principalement des noms de personnes, des noms de lieux, des noms d'organisations, des noms propres, etc.
La tâche nécessite que les chercheurs conçoivent un système capable d'identifier avec précision des entités dans 11 langues, dont le chinois et l'anglais, y compris des modèles de phrases mélangés à plusieurs langues, y compris des « tiges », des abréviations et des expressions familières. Par exemple : « En 2016, elle a joué dans la série télévisée HBO Game of Thrones. » L'IA doit reconnaître et comprendre le nom abrégé de l'organisation « HBO » et le titre de l'œuvre « Game of Thrones ».
Le système Dharma Academy a remporté la première place dans le score total
Le document a proposé un nouveau système de reconnaissance d'entités nommées multilingue qui intègre les connaissances et a remporté 10 premières places parmi les 13 sous-éléments du concours. tâche, avec un score total de 10. Classé premier en termes de points, ce qui a grandement amélioré le niveau de l'industrie.
De manière générale, comme les mots ont des significations ambiguës, nous ne pouvons comprendre avec précision les mots qu'en fonction du contexte, et il en va de même pour l'IA. La puissance du nouveau système est qu’il permet à l’IA de comprendre des mots d’entités complexes même s’il n’y a pas de contexte. Selon les chercheurs, le système introduit des connaissances externes supplémentaires pour construire une base de connaissances générales multilingue, qui élargit les informations contextuelles du texte grâce à une récupération interactive pour éliminer toute ambiguïté, couplée à un réglage fin en plusieurs étapes, et peut identifier avec précision l'entité ; information .
Principe du système de la Dharma Academy
Selon les rapports, ce résultat de recherche primé a de larges perspectives d'application dans des domaines tels que la traduction, la recherche et le dialogue homme-machine. Actuellement, le système de traduction automatique de DAMO Academy peut fournir des services de traduction dans 214 langues, traduisant chaque jour des centaines de millions de mots pour 2 millions de petites et moyennes entreprises nationales, aidant ainsi les produits nationaux à se mondialiser. Le dernier rapport « Cloud AI Developer Service Key Capabilities Report » de Gartner, un organisme de recherche international faisant autorité, souligne qu'Alibaba Language AI s'est classée deuxième au monde, le meilleur résultat de l'histoire des entreprises chinoises.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!