需要改写的内容是:编辑 | 紫罗
在过去的几年里,通过在各种不同的数据集上进行训练,视觉和自然语言处理(NLP)机器学习领域取得了巨大的进步。这导致了「基础模型」的出现
例如,「大型语言模型」引发了 NLP 的复兴:微调或提示通才模型现在已成为标准做法,而不是从头开始训练专业模型。
然而,机器学习在科学数据集上的应用尚未发生类似的范式转变。
这就是「Polymathic AI」(博学人工智能)研究计划寻求解决的一个未实现的机会。
图灵奖得主、Meta 首席科学家 Yann LeCun 表示:「很高兴成为 AI for Science 新计划(Polymathic AI)的顾问」。
剑桥大学AI+天文/物理助理教授Miles Cranmer在Twitter上分享了他参与的一个新计划:Polymathic AI!
「我们正在开发科学[数据]的基础模型,以便它们可以利用跨学科的共享概念。」
网友们纷纷表示:“这太厉害了!这看起来很有趣!这项研究令人惊叹……”
多功能人工智能计划旨在加快开发专为数值数据集和科学机器学习任务定制的基础模型
面临的挑战是建立人工智能模型,利用来自异构数据集和不同科学领域的信息,与自然语言处理等领域相反,这些模型不共享统一的表示(即文本)。
然后,这些模型可以被用作强大的基准,或者由科学家针对特定的应用进行进一步微调。这种方法有可能通过提供现成的模型来实现科学中人工智能的民主化,这些模型对于共享的一般概念(如因果关系、测量、信号处理,甚至更专业的共享概念,如波)具有更强的先验(即背景知识)。否则,这些概念需要从头开始学习
为了实现这个目标,该研究计划汇集了一支由纯机器学习研究人员和领域科学家组成的团队,涵盖各个学科。此外,还接受由世界领先专家组成的科学咨询小组的指导
研究团队。
科学咨询小组。
重写内容为:机构参与
建立真正的科学基础模型需要大量的初步研究。我们的研究计划正在集中精力研究这个领域的基础知识。迄今为止,我们已经发表了关于关键架构组件的研究成果。我们的研究涵盖了适应数值数据的语言模型,展示在不同物理系统上训练的代理模型的可转移性,以及学习多模态科学数据的共享嵌入
这项研究计划对于重新定义科学机器学习前景的潜力感到非常兴奋,而Polymathic AI代表了朝着这一目标迈出的雄心勃勃的一步
项目开源地址:https://github.com/PolymathicAI/
请参考以下内容:https://polymathic-ai.org/blog/announcement/
https://polymathic-ai.org/
https://twitter.com/MilesCranmer/status/1711429121220465037
以上是AI for Science 开源新项目「Polymathic AI」,Yann LeCun担任顾问的详细内容。更多信息请关注PHP中文网其他相关文章!