作者 | 卢彬,韩璐羽
海洋溶解氧是维持海洋生态系统功能的关键因素。随着全球变暖和人类活动的影响,近年来海洋呈现脱氧趋势,日渐窒息的海洋对渔业发展、气候调节等多方面造成严重后果。
最近,上海交通大学电子信息与电气工程学院王新兵、甘小莺教授团队联合上海交通大学海洋学院张经院士、周磊教授、周韫韬副教授,共同提出了一种稀疏海洋观测数据驱动的深度学习模型OxyGenerator。首次对1920年至2023年全球百年海域溶解氧数据进行重建,重建性能显著超过了专家经验主导的CMIP6系列数值模式结果。
研究成果《OxyGenerator: Reconstructing Global Ocean Deoxygenation Over a Century with Deep Learning》目前已被中国计算机学会 A 类会议 International Conference on Machine Learning(ICML)录用,为分析复杂氧循环及气候调节提供了有力的数据支持,是人工智能与海洋学交叉融合的积极尝试。
在过去百年中,气候变化引起的海洋含氧量下降问题已经吸引了广泛关注。在理解OMZ长期变化的工具中,OMZ30(最小含氧带)的迅速扩张被认为是一个关键指标。到2023年,1920年的海洋面积扩大了三倍,这一发现对于理解OMZ长期变化具有重要意义,有助于未来更好地进行海洋监测和保护。
为了全面深入理解海洋脱氧,从有效数据中发掘氧循环及其变化规律,2017 年 Schmidtko 等研究者于《Nature》发文《Decline in global oceanic oxygen content during the past five decades》,首次采用空间插值方法实现了 1960 年以来全球海洋溶解氧数据的重建与定量分析。
评估工业革命以来长期人类活动的具体影响,重建近五十年溶解气候记录远远不够。高度稀疏的历史观测和精度受限的空间插值方法成为解决问题的重要瓶颈。
为此,上海交大的研究团队汇聚了自 1900 年以来包括科考船航次调查数据、Argo 浮标观测数据、深海潜标实时观测等海洋溶解氧相关数据共计 60 亿条(存储数据量约 2TB),并进行了统一质控。
考虑到海洋水体的不规则边缘,以及高度稀疏观测数据的非均匀特征,通过图建模思想建立了四维时空图网络,充分考虑了地理学中的空间相关性、高价值观测样本,实现了观测数据与缺失数据间的跨时空信息传递。
鉴于海洋溶解氧的浓度变化同时受到了海洋物理与生化变量的影响,首先采用多层感知机对多要素数据的进行非线性特征提取,并通过双向长短期记忆网络进行溶解氧观测值的时序变化特征挖掘。
其次,由于全球海洋在不同历史时期和区域呈现异质时空关联,受到海洋学分区思想的启发,提出了自适应可变分区的图消息传递机制(Zoning-Varying Message-Passing),通过超网络参数生成算法,对不同分区的图消息进行仿射变换,实现可变分区的图信息传递。
最后,海洋学领域知识的融合有助于校准神经网络的不确定性。本研究将海洋中氮、磷、氧的理想平衡比例关系(Redfield Ratio),设计了化学知识嵌入的梯度正则化方法,尽可能消除重建结果中的信号异常。
经与观测变量的多折交叉验证,与专家主导的三组 CMIP6 数值模式结果对比,本研究提出的 OxyGenerator 在四个重建性能评估指标上都取得了最佳表现,MAPE 减小了 38.77%,大大降低在开阔海域的重建误差。
在觀察數據充足的西太平洋、受特殊環境條件影響的黑海等區域,OxyGenerator 表現尤為突出,模型性能在百年間保持穩定。同時,結果也很好地重建了歷史時期厄爾尼諾/拉尼娜等特殊氣候事件對溶氧分佈的擾動,也準確體現了溫鹽環流等大時間尺度水體運動特徵。
本研究是人工智慧與海洋科學深度交叉、密切合作的研究成果,為應對全球性氣候挑戰開拓了新思維。未來,團隊將持續推動深入合作數據驅動的地學科學發現研究,積極發展先進技術賦能科學智慧(AI for Science)領域研究。
以上是揭秘100年全球海洋脫氧,上交大透過人工智慧重建「窒息的海洋」,ICML已收錄的詳細內容。更多資訊請關注PHP中文網其他相關文章!