搜索
首页科技周边人工智能华为大模型登Nature正刊!审稿人:让人们重新审视预报模型的未来

比传统方法快1万倍、只需要1.4秒就能完成24小时全球气象预报——它就是来自华为云的盘古气象大模型

今天,它登上了Nature,据称还是近年来首篇以中国科技公司作为唯一署名单位发表的Nature正刊论文(也就是华为云独作)

华为大模型登Nature正刊!审稿人:让人们重新审视预报模型的未来图片

审稿人给予它高度评价,这一模型使人类得以重新审视气象预报模型的未来。

言外之意,就是有了它,原来的传统方法都不香了。

华为大模型登Nature正刊!审稿人:让人们重新审视预报模型的未来图片

那么,它究竟是如何被开发出来的?解决了哪些关键难题?又有何具体成效和应用?

顺着这篇论文带你一文看尽。

解决现有AI气象预报模型精度不足问题

上世纪20年代以来,特别是近三十年随着算力的迅速发展,传统的数值天气预报在每日天气预报、极端灾害预警、气候变化预测等领域取得了巨大的成功。

但是随着算力增长的趋缓和物理模型的逐渐复杂化,这一方式的瓶颈日益突出。

于是研究者们开始挖掘新的气象预报范式如使用深度学习方法预测未来天气。

华为云研发团队于2年前开始这方面的研究。

他们发现,在数值方法应用最广泛的领域如中长期预报中,现有的AI预报方法精度仍然显著低于数值预报方法,并受到可解释性欠缺,极端天气预测不准等问题的制约。

而造成AI气象预报模型精度不足要有两个原因:

第一,现有的AI气象预报模型都是基于2D神经网络,无法很好地处理不均匀的3D气象数据;

第二,AI方法缺少数学物理机理约束,因此在迭代的过程中会不断积累迭代误差。

在此,华为云的研究人员提出3D Earth-Specific Transformer(3DEST)来处理复杂的不均匀3D气象数据,从而打造了盘古气象大模型。

其主要思想是使用一个视觉transformer的3D变种来处理复杂的不均匀的气象要素,并且使用层次化时域聚合策略,训练了4个不同预报间隔的模型(分别为1小时间隔、3小时间隔、6小时间隔、24小时间隔),使得预测特定时间气象状况的迭代次数最小,从而减少迭代误差,也避免了由递归训练带来的训练资源消耗。

为了训练每个模型,研究人员使用1979-2021年的气象数据,以小时为单位采样,训练了100个epoch。

每个模型需要在192块V100显卡上训练16天。事实上,即使经历100个epoch,这些模型依旧没有完全收敛。

也就是说,在计算资源更加充足的情况下,AI预报的精度还能够进一步提升。

最终推理时,盘古气象大模型仅需在一张V100显卡上运行1.4秒,即可完成24小时全球气象预报,包括位势、湿度、风速、温度、海平面气压等,其中水平空间分辨率达到 0.25∘×0.25∘ ,时间分辨率为1小时,覆盖13层垂直高度,可以精准地预测细粒度气象特征。

而作为首个精度超过传统数值预报方法的AI方法,它的计算速度相比传统数值预报提升超过10000倍。

可直接应用于多个下游场景

今年5月,台风“玛娃”走向受到广泛关注。

中央气象局表示,华为云盘古大模型在“玛娃”的路径预报中表现优异,提前五天预报出其将在台湾岛东部海域转向路径。

华为大模型登Nature正刊!审稿人:让人们重新审视预报模型的未来图片

在第19届世界气象大会上,欧洲气象局也指出,华为云盘古气象大模型在精度上有不可否认的能力,纯数据驱动的AI天气预报模型,展现出了可与欧洲中期天气预报中心业务数值模式媲美的预报实力。

欧洲中期天气预报中心主任弗洛伦斯·哈比耶详细地展示了华为云盘古气象大模型与欧洲中期天气预报中心的实时运行检验对比情况:

为了探索AI捕获极端天气的能力,我们研究了今年2月芬兰的一个案例,当时观测到了-29℃的寒潮,我们发现盘古较早认识到了这一事件的严重性。

华为大模型登Nature正刊!审稿人:让人们重新审视预报模型的未来图片

弗洛伦斯·哈比耶还强调,AI预测方法资源消耗少,为发展中国家提供了重要机遇,因为它不再需要大规模的超算资源,还为提升全球预报能力提供了难得的机遇。

至于华为云选择AI气象预报领域作为一个“突破口”,一方面,气象预报尤其是对极端天气如暴雨、台风、干旱、寒潮的精准预测关乎国际民生,另一方面,气象预测问题非常复杂,AI可以从海量数据中挖掘出新的大气演变规律,在精度和速度上具有巨大的提升潜力。

据了解,世界气象组织(WMO)即将发布的WMO2024—2027年战略计划吸收了人工智能元素,使其成为推动气象科技发展的重要力量。

WMO还将积极推动AI在临近预报及数值天气预报等领域的示范应用,创建人工智能产品应用国际比对平台,制定AI气象应用标准和指南,推动人工智能数据集共享等相关工作,探索并发挥AI在气象领域的应用潜力,有效支撑全民早期预警倡议。

未来三大关键

最后,华为云盘古气象大模型团队如何看待AI气象预报的未来?

答案是三大关键:

首先大数据。庞大的气象数据是AI模型的基石,当前盘古气象大模型仅使用部分ERA5再分析数据,未来的AI模型将基于海量的、更精细的全球观测数据。

其次,大算力。气象数据超高的分辨率对AI模型的训练造成了巨大的挑战,盘古气象大模型现在的输入分辨率为1440×720×14×5,相比计算视觉任务常用的分辨率224×224×3大约500倍,随着分辨率的进一步增加和模型的增大,需要的算力资源也会迅速增加。

最后,大模型。复杂的气象规律,超高的分辨率与庞大的数据量都决定了AI气象预报需要使用计算量极高的AI模型。
同时,想要不断迭代领先的AI气象预报模型,稳定的云上环境、工作套件和对应的运维也是必不可少的。

论文地址:https://www.nature.com/articles/s41586-023-06185-3

以上是华为大模型登Nature正刊!审稿人:让人们重新审视预报模型的未来的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:51CTO.COM。如有侵权,请联系admin@php.cn删除
外推指南外推指南Apr 15, 2025 am 11:38 AM

介绍 假设有一个农民每天在几周内观察农作物的进展。他研究了增长率,并开始思考他的植物在几周内可以生长的高度。从Th

软AI的兴起及其对当今企业的意义软AI的兴起及其对当今企业的意义Apr 15, 2025 am 11:36 AM

软AI(被定义为AI系统,旨在使用近似推理,模式识别和灵活的决策执行特定的狭窄任务 - 试图通过拥抱歧义来模仿类似人类的思维。 但是这对业务意味着什么

为AI前沿的不断发展的安全框架为AI前沿的不断发展的安全框架Apr 15, 2025 am 11:34 AM

答案很明确 - 只是云计算需要向云本地安全工具转变,AI需要专门为AI独特需求而设计的新型安全解决方案。 云计算和安全课程的兴起 在

生成AI的3种方法放大了企业家:当心平均值!生成AI的3种方法放大了企业家:当心平均值!Apr 15, 2025 am 11:33 AM

企业家,并使用AI和Generative AI来改善其业务。同时,重要的是要记住生成的AI,就像所有技术一样,都是一个放大器 - 使得伟大和平庸,更糟。严格的2024研究O

Andrew Ng的新简短课程Andrew Ng的新简短课程Apr 15, 2025 am 11:32 AM

解锁嵌入模型的力量:深入研究安德鲁·NG的新课程 想象一个未来,机器可以完全准确地理解和回答您的问题。 这不是科幻小说;多亏了AI的进步,它已成为R

大语言模型(LLM)中的幻觉是不可避免的吗?大语言模型(LLM)中的幻觉是不可避免的吗?Apr 15, 2025 am 11:31 AM

大型语言模型(LLM)和不可避免的幻觉问题 您可能使用了诸如Chatgpt,Claude和Gemini之类的AI模型。 这些都是大型语言模型(LLM)的示例,在大规模文本数据集上训练的功能强大的AI系统

60%的问题 -  AI搜索如何消耗您的流量60%的问题 - AI搜索如何消耗您的流量Apr 15, 2025 am 11:28 AM

最近的研究表明,根据行业和搜索类型,AI概述可能导致有机交通下降15-64%。这种根本性的变化导致营销人员重新考虑其在数字可见性方面的整个策略。 新的

麻省理工学院媒体实验室将人类蓬勃发展成为AI R&D的核心麻省理工学院媒体实验室将人类蓬勃发展成为AI R&D的核心Apr 15, 2025 am 11:26 AM

埃隆大学(Elon University)想象的数字未来中心的最新报告对近300名全球技术专家进行了调查。由此产生的报告“ 2035年成为人类”,得出的结论是,大多数人担心AI系统加深的采用

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
4 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
4 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
4 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.聊天命令以及如何使用它们
4 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

螳螂BT

螳螂BT

Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

SublimeText3 英文版

SublimeText3 英文版

推荐:为Win版本,支持代码提示!

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),