7月19日消息,全球规模最大的语义测评竞赛SemEval-2022近日宣布,将今年唯一的“最佳系统论文奖”颁发给阿里达摩院等机构的研究人员。他们为中英文在内的11种语言设计出一套融入知识的命名实体识别(NER)系统,能够精准识别出人名、地名、机构、作品等关键性的实体信息,有力提升了AI理解人类语言的能力。
SemEval(Semantic Evaluation语义评测)是自然语言处理领域的权威国际竞赛,已有超过20年历史,由国际计算机语言学学会(ACL)的词汇和语义小组主办,旨在让AI去分析、理解人类语言中蕴含的意义。
SemEval的最佳论文奖共有两个:最佳任务论文奖(Best Task Paper Award)和最佳系统论文奖(Best System Paper Award)。通俗理解,一个是提问题,另一个是解决问题。阿里达摩院与上海科技大学、浙江大学、新加坡科技设计大学的联合研究团队摘得了今年的最佳系统论文奖,这篇从221篇候选论文中脱颖而出的文章名为《DAMO-NLP at SemEval-2022 Task 11: A Knowledge-based System for Multilingual Named Entity Recognition》。
SemEval-2022最佳系统论文
获奖团队参加了SemEval-2022的12项任务之一:多语言复杂命名实时识别(Multilingual Complex Named Entity Recognition)。命名实体识别(NER)是自然语言处理领域的基础性工作,是指识别文本中具有特定意义的实体词(Entity),主要包括人名、地名、机构名、专有名词等。
任务要求研究人员设计一套系统,能够识别中文、英语在内的11种语言中的实体,包括在多语言夹杂、有“梗”、有缩写、有俗语的句式中,做到精准识别。比如例句:“2016年,她客串出演了HBO电视剧权力的游戏”,AI需要识别理解出“HBO”这个缩略的机构名,还有“权力的游戏”这个作品名。
达摩院系统获得总分第一
论文提出了一套全新的融入知识的多语言命名实体识别系统,在比赛任务的13个子项中获得10个第一,总分排名第一,较大幅度提升了业界水平。
一般来说,由于词语具有多义性,只有结合上下文语境,我们才能准确理解词语,AI也是如此。新系统的强大之处在于,即便缺乏上下文语境,也能让AI理解复杂的实体词。研究人员介绍,该系统额外引入外部知识,构建了一个多语言通用知识库,通过交互型的检索来扩充文本的上下文信息,从而消除歧义;再加上多阶段的微调,可以实现精准识别实体信息。
达摩院系统原理示意
据介绍,这项获奖研究成果在翻译、搜索、人机对话等领域有着广泛的应用前景。目前,达摩院的机器翻译系统能提供214种语言的互译服务,每天为国内200万中小商家翻译上亿文字,助力国货走向全世界。国际权威研究机构Gartner最新报告《云AI开发者服务关键能力报告》指出,阿里语言AI已排名全球第二,创中国企业历史最佳成绩。
以上是阿里达摩院获SemEval最佳论文 让AI更懂人类语言的详细内容。更多信息请关注PHP中文网其他相关文章!

动荡游戏:与AI代理商的游戏开发彻底改变 Roupheaval是一家游戏开发工作室,由暴风雪和黑曜石等行业巨头的退伍军人组成,有望用其创新的AI驱动的Platfor革新游戏创作

Uber的Robotaxi策略:自动驾驶汽车的骑车生态系统 在最近的Curbivore会议上,Uber的Richard Willder推出了他们成为Robotaxi提供商的乘车平台的策略。 利用他们在

事实证明,视频游戏是尖端AI研究的宝贵测试场所,尤其是在自主代理和现实世界机器人的开发中,甚至有可能促进人工通用智能(AGI)的追求。 一个

不断发展的风险投资格局的影响在媒体,财务报告和日常对话中显而易见。 但是,对投资者,初创企业和资金的具体后果经常被忽略。 风险资本3.0:范式

Adobe Max London 2025对Creative Cloud和Firefly进行了重大更新,反映了向可访问性和生成AI的战略转变。 该分析结合了事件前简报中的见解,并融合了Adobe Leadership。 (注意:Adob

Meta的Llamacon公告展示了一项综合的AI策略,旨在直接与OpenAI等封闭的AI系统竞争,同时为其开源模型创建了新的收入流。 这个多方面的方法目标bo

人工智能领域对这一论断存在严重分歧。一些人坚称,是时候揭露“皇帝的新衣”了,而另一些人则强烈反对人工智能仅仅是普通技术的观点。 让我们来探讨一下。 对这一创新性人工智能突破的分析,是我持续撰写的福布斯专栏文章的一部分,该专栏涵盖人工智能领域的最新进展,包括识别和解释各种有影响力的人工智能复杂性(请点击此处查看链接)。 人工智能作为普通技术 首先,需要一些基本知识来为这场重要的讨论奠定基础。 目前有大量的研究致力于进一步发展人工智能。总目标是实现人工通用智能(AGI)甚至可能实现人工超级智能(AS

公司AI模型的有效性现在是一个关键的性能指标。自AI BOOM以来,从编写生日邀请到编写软件代码的所有事物都将生成AI使用。 这导致了语言mod的扩散


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

DVWA
Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

螳螂BT
Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

SecLists
SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

PhpStorm Mac 版本
最新(2018.2.1 )专业的PHP集成开发工具

禅工作室 13.0.1
功能强大的PHP集成开发环境