首頁 >科技週邊 >人工智慧 >阿里達摩院獲SemEval最佳論文 讓AI更懂人類語言

阿里達摩院獲SemEval最佳論文 讓AI更懂人類語言

王林
王林轉載
2023-04-09 12:21:051787瀏覽

7月19日消息,全球規模最大的語意評測競賽SemEval-2022近日宣布,將今年唯一的「最佳系統論文獎」頒發給阿里達摩院等機構的研究人員。他們為中英文在內的11種語言設計出一套融入知識的命名實體識別(NER)系統,能夠精準識別出人名、地名、機構、作品等關鍵性的實體信息,有力提升了AI理解人類語言的能力。

SemEval(Semantic Evaluation語意評測)是自然語言處理領域的權威國際競賽,已有超過20年歷史,由國際電腦語言學學會(ACL)的詞彙和語意小組主辦,旨在讓AI去分析、理解人類語言中蘊含的意義。

SemEval的最佳論文獎共有兩個:最佳任務論文獎(Best Task Paper Award)和最佳系統論文獎(Best System Paper Award)。通俗理解,一個是提問題,一個是解決問題。阿里達摩院與上海科技大學、浙江大學、新加坡科技設計大學的聯合研究團隊摘得了今年的最佳系統論文獎,這篇從221篇候選論文中脫穎而出的文章名為《DAMO-NLP at SemEval- 2022 Task 11: A Knowledge-based System for Multilingual Named Entity Recognition》。

阿里達摩院獲SemEval最佳論文 讓AI更懂人類語言

SemEval-2022最佳系統論文

 

獲獎團隊參加了SemEval-2022的12個任務之一:多語言複雜命名即時辨識(Multilingual Complex Named Entity Recognition)。命名實體辨識(NER)是自然語言處理領域的基礎性工作,指辨識文本中具有特定意義的實體字詞(Entity),主要包括人名、地名、機構名、專有名詞等。

任務要求研究者設計一套系統,能夠辨識中文、英文在內的11種語言中的實體,包括在多語言夾雜、有「梗」、有縮寫、有俗語的句式中,做到精準識別。例如例句:“2016年,她客串出演了HBO電視劇權力的遊戲”,AI需要識別理解出“HBO”這個縮略的機構名,還有“權力的遊戲”這個作品名。

阿里達摩院獲SemEval最佳論文 讓AI更懂人類語言

達摩院系統獲得總分第一

論文提出了一套全新的融入知識的多語言命名實體辨識系統,在比賽任務的13個子項中獲得10個第一,總分排名第一,較大幅度提升了業界水準。

一般來說,由於字詞具有多義性,只有結合上下文語境,我們才能準確理解詞語,AI也是如此。新系統的強大之處在於,即便缺乏上下文語境,也能讓AI理解複雜的實體字。研究人員介紹,該系統額外引入外部知識,構建了一個多語言通用知識庫,透過交互型的檢索來擴充文本的上下文訊息,從而消除歧義;再加上多階段的微調,可以實現精準識別實體訊息。

阿里達摩院獲SemEval最佳論文 讓AI更懂人類語言

達摩院系統原理示意

#據介紹,這項獲獎研究成果在翻譯、搜尋、人機對話等領域有著廣泛的應用前景。目前,達摩院的機器翻譯系統能提供214種語言的互譯服務,每天為國內200萬中小商家翻譯上億文字,助力國貨走向全世界。國際權威研究機構Gartner最新報告《雲端AI開發者服務關鍵能力報告》指出,阿里語言AI已排名全球第二,創中國企業史上最佳成績。


以上是阿里達摩院獲SemEval最佳論文 讓AI更懂人類語言的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除