搜索
首页科技周边人工智能巧解「数据稀缺」问题!清华开源GPD:用扩散模型生成神经网络参数

传统的时空预测模型通常需要大量数据支持才能取得良好效果。

然而,由于不同城市发展水平的差异和数据收集政策的不一致,许多地区的时空数据(例如交通和人群流动数据)受到了限制。因此,在数据稀缺的情况下,模型的可迁移性变得尤为重要。

目前的研究主要依靠源城市的数据来训练模型,并将其应用于目标城市的数据,但这种方法通常需要复杂的匹配设计。如何实现源城市和目标城市之间更广泛的知识迁移仍然是一个具有挑战性的问题。

最近,预训练模型在自然语言处理和计算机视觉领域取得了重大进展。引入prompt(提示)技术缩小了微调和预训练之间的差距,使得先进的预训练模型能够更快速地适应新的任务。这种方法的优势在于减少了对繁琐微调的依赖,提高了模型的效率和灵活性。通过prompt技术,模型可以更好地理解用户的需求,并产生更准确的输出,从而为人们提供更好的体验和服务。这种创新性的方法正在推动人工智能技术的发展,为各行业带来了更多可能性和机遇。

巧解「数据稀缺」问题!清华开源GPD:用扩散模型生成神经网络参数图片

论文链接:https://openreview.net/forum?id=QyFm3D3Tzi

开源代码及数据:https://www.php.cn/link/6644cb08d30b2ca55c284344a9750c2e

最新发表在ICLR2024的清华大学电子工程系城市科学与计算研究中心的成果《Spatio-Temporal Few-Shot Learning via Diffusive Neural Network Generation》引入了GPD(Generative Pre-Trained Diffusion)模型,成功实现了在数据稀疏场景下的时空学习。

这种方法利用生成神经网络的参数,将时空稀疏数据学习转化为扩散模型的生成式预训练问题。与传统方法不同,该方法不再需要提取可迁移特征或设计复杂的模式匹配策略,也无需为少样本场景学习一个良好的模型初始化。

相反,该方法通过在源城市的数据上进行预训练来学习有关神经网络参数优化的知识,然后根据提示生成适用于目标城市的神经网络模型。

这一方法的创新之处在于能够根据「prompt(提示)」生成定制的神经网络,有效地适应不同城市之间的数据分布和特征差异,实现巧妙的时空知识迁移。

该研究为解决城市计算中数据稀缺性问题提供了新的思路。该论文的数据和代码均已开源。

从数据分布到神经网络参数分布

巧解「数据稀缺」问题!清华开源GPD:用扩散模型生成神经网络参数图 1:数据模式层面知识迁移 vs. 神经网络层面知识迁移

如图1(a)所示,传统的知识迁移方法通常是在源城市的数据上训练模型,然后将其应用于目标城市。然而,不同城市之间的数据分布可能存在显著差异,这导致直接迁移源城市模型可能无法很好地适应目标城市的数据分布。

因此,我们需要摆脱对杂乱数据分布的依赖,寻求一种更本质、更可迁移的知识共享方式。与数据分布相比,神经网络参数的分布更具有“高阶”的特性。

图 1 展示了从数据模式层面到神经网络层面知识迁移的转变过程。通过在源城市的数据上训练神经网络,并将其转化为生成适应目标城市的神经网络参数的过程,可以更好地适应目标城市的数据分布和特征。

预训练+提示微调:实现时空少样本学习

巧解「数据稀缺」问题!清华开源GPD:用扩散模型生成神经网络参数图2 GPD模型概览

如图2所示,该研究提出的GPD是一种条件生成框架,旨在直接从源城市的模型参数中学习,并为目标城市生成新的模型参数,该方法包括三个关键阶段:

1. 神经网络准备阶段:首先,针对每个源城市区域,该研究训练单独的时空预测模型,并保存其优化后的网络参数。每个区域的模型参数都经过独立优化,没有参数共享,以确保模型能够最大程度地适应各自区域的特征。

2. 扩散模型预训练:该框架使用收集到的预训练模型参数作为训练数据,训练扩散模型来学习生成模型参数的过程。扩散模型通过逐步去噪来生成参数,这个过程类似于从随机初始化开始的参数优化过程,因此能够更好地适应目标城市的数据分布。

3. 神经网络参数生成:在预训练后,可以通过使用目标城市的区域提示来生成参数。这种方法利用提示促进了知识转移和精确参数匹配,充分利用了城市间区域之间的相似性。

值得注意的是,在预训练-提示微调的框架中,提示的选择具有很高的灵活性,只要能够捕捉特定区域的特征即可。例如可以利用各种静态特征,如人口、区域面积、功能和兴趣点(POI)的分布等来实现这一目的。

这项工作从空间和时间两个方面利用区域提示:空间提示来自于城市知识图谱[1,2]中节点表征,它仅利用区域邻接性和功能相似性等关系,这些关系在所有城市中都很容易获取;时间提示来自于自监督学习模型的编码器。更多关于提示设计的细节请参见原文。

此外,该研究还探索了不同的提示引入方法,实验验证了基于先验知识的提示引入具有最优性能:用空间提示引导建模空间关联的神经网络参数生成,用时间提示引导时序神经网络参数生成。

实验结果

团队在论文中详细描述了实验设置,以帮助其他研究者复现其结果。他们还提供了原论文和开源数据代码,我们在这里关注其实验结果。

为了评估所提框架的有效性,该研究在两类经典的时空预测任务上进行了实验:人群流动预测和交通速度预测,覆盖了多个城市的数据集。

巧解「数据稀缺」问题!清华开源GPD:用扩散模型生成神经网络参数图片

表1展示了在四个数据集上相对于最先进基线方法的比较结果。根据这些结果,可以得出以下观察:

1)GPD相对于基线模型表现出显著的性能优势,在不同数据场景下一致表现优越,这表明GPD实现了有效的神经网络参数层面的知识迁移。

2)GPD在长期预测场景中表现出色,这一显著趋势可以归因于该框架对于更本质知识的挖掘,有助于将长期时空模式知识迁移到目标城市。

巧解「数据稀缺」问题!清华开源GPD:用扩散模型生成神经网络参数图3 不同时空预测模型的性能对比

此外,该研究还验证了GPD框架对于不同时空预测模型适配的灵活性。除了经典的时空图方法STGCN外,该研究还引入了GWN和STID作为时空预测模型,并使用扩散模型生成其网络参数。

实验结果表明,框架的优越性不会受到模型选择的影响,因此可以适配各种先进的模型。

进一步地,该研究通过在两个合成数据集上操纵模式相似性进行案例分析。

图4展示了区域A和B具有高度相似的时间序列模式,而区域C展示了明显不同的模式。同时,图5显示节点A和B具有对称的空间位置。

因此,我们可以推断区域A和B具有非常相似的时空模式,而与C有着明显的差异。模型生成的神经网络参数分布结果显示,A和B的参数分布相似,而与C的参数分布有显著差异。这进一步验证了GPD框架在有效生成具有多样化时空模式的神经网络参数的能力。

巧解「数据稀缺」问题!清华开源GPD:用扩散模型生成神经网络参数

图 4 不同区域的时间序列及神经网络参数分布可视化

巧解「数据稀缺」问题!清华开源GPD:用扩散模型生成神经网络参数

图 5 仿真数据集区域空间连接关系

参考资料:

https://www.php.cn/link/6644cb08d30b2ca55c284344a9750c2e

[1] Liu, Yu, et al. "Urbankg: An urban knowledge graph system." ACM Transactions on Intelligent Systems and Technology 14.4 (2023): 1-25.

[2] Zhou, Zhilun, et al. "Hierarchical knowledge graph learning enabled socioeconomic indicator prediction in location-based social network." Proceedings of the ACM Web Conference 2023. 2023.

以上是巧解「数据稀缺」问题!清华开源GPD:用扩散模型生成神经网络参数的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:51CTO.COM。如有侵权,请联系admin@php.cn删除
Simpson的悖论如何发现数据中隐藏的趋势? - 分析VidhyaSimpson的悖论如何发现数据中隐藏的趋势? - 分析VidhyaApr 23, 2025 am 09:20 AM

辛普森的悖论:揭示数据中的隐藏趋势 您是否曾经被统计数据误导?辛普森(Simpson)的悖论展示了汇总数据如何掩盖关键趋势,从而揭示了分析多个级别数据的重要性。这个简洁的gui

什么是名义数据? - 分析Vidhya什么是名义数据? - 分析VidhyaApr 23, 2025 am 09:13 AM

介绍 名义数据构成了数据分析的基石,在统计,计算机科学,心理学和营销等各个领域中起着至关重要的作用。 本文深入研究了Nomi的特征,应用和区分

什么是一声提示? - 分析Vidhya什么是一声提示? - 分析VidhyaApr 23, 2025 am 09:12 AM

介绍 在机器学习的动态世界中,使用最小数据有效生成精确的响应至关重要。 一声提示提供了一个强大的解决方案,使AI模型仅使用一个示例执行特定任务

特斯拉的Robovan是2024年的Robotaxi预告片中的隐藏宝石特斯拉的Robovan是2024年的Robotaxi预告片中的隐藏宝石Apr 22, 2025 am 11:48 AM

自2008年以来,我一直倡导这辆共享乘车面包车,即后来被称为“ Robotjitney”,后来是“ Vansit”,这是城市运输的未来。 我预见这些车辆是21世纪的下一代过境解决方案Surpas

Sam俱乐部在AI上押注以消除收据检查并增强零售Sam俱乐部在AI上押注以消除收据检查并增强零售Apr 22, 2025 am 11:29 AM

革新结帐体验 Sam's Club的创新性“ Just Go”系统建立在其现有的AI驱动“扫描和GO”技术的基础上,使会员可以在购物旅行期间通过Sam's Club应用程序进行扫描。

Nvidia的AI Omniverse在GTC 2025扩展Nvidia的AI Omniverse在GTC 2025扩展Apr 22, 2025 am 11:28 AM

NVIDIA在GTC 2025上的增强可预测性和新产品阵容 NVIDIA是AI基础架构的关键参与者,正在专注于提高其客户的可预测性。 这涉及一致的产品交付,达到绩效期望以及

探索Google的功能探索Google的功能Apr 22, 2025 am 11:26 AM

Google的Gemma 2:强大,高效的语言模型 Google的Gemma语言模型家族以效率和性能而庆祝,随着Gemma 2的到来而扩展。此最新版本包括两种模型:270亿个参数VER

下一波《 Genai:与Kirk Borne博士的观点》 -Analytics Vidhya下一波《 Genai:与Kirk Borne博士的观点》 -Analytics VidhyaApr 22, 2025 am 11:21 AM

这一领先的数据剧集以数据科学家,天体物理学家和TEDX演讲者Kirk Borne博士为特色。 Borne博士是大数据,AI和机器学习的著名专家,为当前状态和未来的Traje提供了宝贵的见解

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

功能强大的PHP集成开发环境

螳螂BT

螳螂BT

Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)