Heim > Artikel > Technologie-Peripheriegeräte > Die Alibaba DAMO Academy gewinnt die beste Arbeit von SemEval, um KI dabei zu helfen, die menschliche Sprache besser zu verstehen
Laut Nachrichten vom 19. Juli gab SemEval-2022, der weltweit größte semantische Bewertungswettbewerb, kürzlich bekannt, dass der einzige „Best System Paper Award“ in diesem Jahr an Forscher der Alibaba Damo Academy und anderer Institutionen vergeben wird. Sie haben ein NER-System (Named Entity Recognition) entwickelt, das Wissen für 11 Sprachen, darunter Chinesisch und Englisch, umfasst. Es kann wichtige Entitätsinformationen wie Namen von Personen, Ortsnamen, Institutionen, Werke usw. genau identifizieren, was das Verständnis der KI effektiv verbessert menschliche Sprachfähigkeit.
SemEval (Semantic Evaluation) ist ein maßgeblicher internationaler Wettbewerb auf dem Gebiet der Verarbeitung natürlicher Sprache mit einer mehr als 20-jährigen Geschichte. Er wird von der Lexicon and Semantics Group der International Association for Computer Linguistics (ACL) ausgerichtet und soll dies ermöglichen KI zum Analysieren und Verstehen der in der menschlichen Sprache eingebetteten Bedeutung.
SemEval hat zwei Auszeichnungen für die beste Arbeit: Best Task Paper Award und Best System Paper Award. Nach allgemeiner Auffassung besteht das eine darin, Fragen zu stellen, und das andere darin, Probleme zu lösen. Das gemeinsame Forschungsteam der Alibaba DAMO Academy, der Shanghai University of Science and Technology, der Zhejiang University und der Singapore University of Technology and Design gewann den diesjährigen Best System Paper Award. Der Artikel, der aus 221 Kandidatenbeiträgen herausragte, heißt „DAMO-NLP at“. SemEval- 2022 Aufgabe 11: Ein wissensbasiertes System für die Erkennung mehrsprachiger benannter Entitäten》.
SemEval-2022 Best System Paper
Das Gewinnerteam nahm an einer der 12 Aufgaben von SemEval-2022 teil: Multilingual Complex Named Entity Recognition. Die Erkennung benannter Entitäten (NER) ist eine grundlegende Arbeit auf dem Gebiet der Verarbeitung natürlicher Sprache. Sie bezieht sich auf die Identifizierung von Entitätswörtern (Entitäten) mit spezifischen Bedeutungen im Text, darunter hauptsächlich Namen von Personen, Ortsnamen, Organisationsnamen und Eigennamen. usw.
Die Aufgabe erfordert, dass Forscher ein System entwerfen, das Entitäten in 11 Sprachen, einschließlich Chinesisch und Englisch, einschließlich Satzmustern, die mit mehreren Sprachen gemischt sind, einschließlich „Stielen“, Abkürzungen und Umgangssprache, genau identifizieren kann. Zum Beispiel: „Im Jahr 2016 spielte sie eine Gastrolle in der HBO-TV-Serie Game of Thrones.“ Die KI muss den abgekürzten Organisationsnamen „HBO“ und den Titel des Werks „Game of Thrones“ erkennen und verstehen.
Dharma Academy-System gewann den ersten Platz in der Gesamtpunktzahl
Der Artikel schlug ein neues mehrsprachiges Erkennungssystem für benannte Entitäten vor, das Wissen einbezieht, und gewann 10 erste Plätze unter den 13 Unterpunkten des Wettbewerbs Aufgabe mit einer Gesamtpunktzahl von 10. Platz eins in Bezug auf die Punkte, was das Niveau der Branche erheblich verbessert hat.
Da Wörter mehrdeutige Bedeutungen haben, können wir Wörter im Allgemeinen nur anhand des Kontexts genau verstehen, und das Gleiche gilt für KI. Die Stärke des neuen Systems besteht darin, dass es der KI ermöglicht, komplexe Entitätswörter auch dann zu verstehen, wenn kein Kontext vorhanden ist. Den Forschern zufolge führt das System zusätzliches externes Wissen ein, um eine mehrsprachige allgemeine Wissensbasis aufzubauen, die die Kontextinformationen des Textes durch interaktives Abrufen erweitert, um Mehrdeutigkeiten zu beseitigen, gepaart mit mehrstufiger Feinabstimmung, und es kann Entitäten genau identifizieren Information .
Dharma Academy Systemprinzip
Berichten zufolge hat dieses preisgekrönte Forschungsergebnis breite Anwendungsaussichten in Bereichen wie Übersetzung, Suche und Mensch-Computer-Dialog. Derzeit kann das maschinelle Übersetzungssystem der DAMO Academy Übersetzungsdienste in 214 Sprachen anbieten und täglich Hunderte Millionen Wörter für 2 Millionen inländische kleine und mittlere Unternehmen übersetzen und so dazu beitragen, dass heimische Produkte weltweit verbreitet werden. Der neueste Bericht „Cloud AI Developer Service Key Capabilities Report“ von Gartner, einer renommierten internationalen Forschungsorganisation, weist darauf hin, dass Alibaba Language AI weltweit den zweiten Platz belegt hat, das beste Ergebnis in der Geschichte chinesischer Unternehmen.
Das obige ist der detaillierte Inhalt vonDie Alibaba DAMO Academy gewinnt die beste Arbeit von SemEval, um KI dabei zu helfen, die menschliche Sprache besser zu verstehen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!