編輯 | XS
Nature 在 2023 年 11 月發表了兩項重要研究成果:蛋白質合成技術 Chroma 和晶體材料設計方法 GNoME。這兩項研究都採用了圖神經網路作為處理科學資料的工具。
實際上,圖神經網絡,特別是幾何圖神經網絡,一直是科學智慧(AI for Science)研究的重要工具。這是因為,科學領域中的粒子、分子、蛋白質、晶體等物理系統都可以被建模成一種特殊的資料結構──幾何圖。
與一般的拓樸圖不同,為了更好地描述物理系統,幾何圖加入了不可或缺的空間信息,需要滿足平移、旋轉和翻轉的物理對稱性。鑑於幾何圖神經網路對於物理系統建模的優越性,近年來各類方法層出不窮,論文數量持續成長。
近日,人大高瓴聯合騰訊 AI Lab、清華、史丹佛等機構發布綜述論文:《A Survey of Geometric Graph Neural Networks: Data Structures, Models and Applications》。此綜述在簡要介紹群論、對稱性等理論知識的基礎上,從資料結構、模型到眾多科學應用,對相關幾何圖神經網路文獻進行了系統性的梳理。
論文連結:https://arxiv.org/abs/2403.00485
GitHub連結:https:/ /github.com/RUC-GLAD/GGNN4Science
在這篇綜述中,作者研究了300 多篇參考文獻,歸納出3 種不同的幾何圖神經網路模型,介紹了面向粒子、分子、蛋白質等多種科學數據上共23 種不同任務的相關方法,收集了50 多個相關評測資料集。最後,綜述展望了未來的研究方向,包括幾何圖基礎模型、與大語言模型結合等。
以下是各章節簡單介紹。
幾何圖資料結構
幾何圖由鄰接矩陣、節點特徵、節點幾何資訊(例如座標)構成。在歐氏空間中,幾何圖通常表現出平移、旋轉和反射的物理對稱性,一般使用群來刻畫這些變換,包括歐式群、平移群、正交群、置換群等等。直觀上看,可以理解為置換、平移、旋轉、翻轉四種操作依一定順序的複合。
對於眾多 AI for Science 領域,幾何圖是一種有力且通用的表示方法,其可用於表示眾多物理系統,包括小分子、蛋白質、晶體、物理點雲等。
幾何圖神經網路模型
#根據實際問題中的求解目標對於對稱性的要求,本文將幾何圖神經網路分為三類:不變(invariant)模型、等變(equivariant)模型、以及受Transformer 架構啟發的Geometric Graph Transformer,其中等變模型又細分為標量化方法模型(Scalarization-Based Model)與基於球面調和的高階可操控模型(High-Degree Steerable Model)。按照上述規則,文章收集並歸類了近年來知名的幾何圖神經網路模型。
這裡我們透過各分支的代表性工作簡單介紹不變模型(SchNet[1])、標量化方法模型(EGNN[2])、高階可操控模型(TFN[3])的關聯與差異。可以發現三者皆是採用了訊息傳遞機制,只是身為等變模型的後兩者額外引入了一次幾何訊息傳遞。
不變模型主要利用節點本身的特徵(如原子種類、質量、帶電量等)與原子間不變的特徵(如距離、角度[4]、二面角[5])等進行訊息計算,隨後進行傳播。
而在此之上,標量化方法額外透過節點間座標差引入了幾何訊息,並將不變資訊作為幾何資訊的權重進行線性組合,實現了等變性的引入。
高階可操控模型則是使用了高階的球面調和(Spherical Harmonics)與Wigner-D 矩陣表徵系統的幾何信息,這類方法透過量子力學中的Clebsch–Gordan 係數操控不可約表示的階數,從而實現幾何訊息傳遞過程。
幾何圖神經網路透過這類設計保證的對稱性,準確率有大幅提升,並且在生成任務中也大放異彩。
下圖是幾何圖神經網路與傳統模型在QM9、PDBBind、SabDab 三個資料集上進行分子性質預測、蛋白質-配體對接和抗體設計(生成)三個任務中的結果,可以明顯看出幾何圖神經網路的優勢。
科學應用
在科學應用方面,綜述涵蓋了物理(粒子)、生物化學(小分子、蛋白質)以及其它如晶體等多個應用場景,任務定義與所需保證對稱性種類出發,分別介紹了各個任務中的常用數據集與該類任務中的經典模型設計思路。
上表展示了各個領域的常見任務與經典模型,其中,按照單一實例與多實例(如化學反應,需要多分子共同參與),文章單獨區分了小分子-小分子、小分子-蛋白質、蛋白質-蛋白質三個領域。
為了更好地方便領域內進行模型設計與實驗開展,文章依照單一實例與多實例統計了兩類任務的常用資料集與基準(benchmark),並記錄了不同資料集的樣本量與任務種類。
下表整理了常見的單一實例任務資料集。
下表整理了常見的多實例任務資料集。
未來展望
文章就幾個面向進行了初步的展望,希望能作拋磚引玉之用:
1. 幾何圖基礎模型
在各種任務和領域中採用統一的基礎模型的優越性在GPT系列模型的顯著進步中已經體現得淋漓盡致。如何在任務空間、資料空間、模型空間進行合理的設計,從而將這種想法引入到針對幾何圖神經網路的設計上仍是一個有趣的開放問題。
2. 模型訓練與現實世界實驗驗證的高效循環
科學資料的獲取是昂貴且耗時的,而僅在獨立資料集上評估的模型不能直接反應來自現實世界的回饋。如何類似於GNoME(整合了一個端到端的流水線,包括圖網絡訓練、密度泛函理論計算和用於材料發現和合成的自動實驗室)實現高效的模型-現實循環迭代的實驗範式的重要性將會與日俱增。
3. 與大型語言模型(LLMs)的融合
大型語言模型(LLMs)已被廣泛證明具有豐富的知識,涵蓋了各個領域。雖然已經有一些工作利用 LLMs 進行某些任務,例如分子屬性預測和藥物設計,但它們僅在基元或分子圖上操作。如何將它們與幾何圖神經網路有機組合,使其能夠處理 3D 結構資訊並在 3D 結構上執行預測或生成,仍然具有相當的挑戰性。
4. 等變性約束條件的放鬆
毫無疑問,等變性對增強資料效率和模型泛化能力至關重要,但值得注意的是,過強等變性約束有時可能過於限制模型,潛在地損害其性能。因此,如何使得所設計的模型在等變性與適應能力中取得平衡是一個非常有趣的問題。這方面的探索不僅可以豐富我們對模型行為的理解,還可以為開發更具穩健性和通用性的解決方案鋪平道路,使其具有更廣泛的適用性。
參考文獻
[1] Schütt K, Kindermans P J, Sauceda Felix H E, et al. Schnet: A continuous-filter convolutional neural network for modeling quantum interactions[ J]. Advances in neural information processing systems, 2017, 30.
[2] Satorras VG, Hoogeboom E, Welling M. E(n)等變圖神經網路[C]//機器學習國際會議。 PMLR,2021:9323-9332。
[3] Thomas N、Smidt T、Kearnes S 等人。張量場網路:3d 點雲的旋轉和平移等變神經網路[J]. arXiv 預印本 arXiv:1802.08219, 2018.
[4] Gasteiger J, Groß J, Günnemann S. 分子圖的定向訊息傳遞[C]//學習表示國際會議。 2019.
[5] Gasteiger J, Becker F, Günnemann S. Gemnet: 分子的通用有向圖神經網路[J].神經資訊處理系統進展,2021, 34: 6790-6802。
[6] Merchant A、Batzner S、Schoenholz S S 等。擴展深度學習以促進材料發現[J].自然, 2023, 624(7990): 80-85.
以上是AI4Science的基石:幾何圖神經網絡,最完整綜述來了!人大高瓴聯合騰訊AI lab、清華、史丹佛等發布的詳細內容。更多資訊請關注PHP中文網其他相關文章!

近年来,图神经网络(GNN)取得了快速、令人难以置信的进展。图神经网络又称为图深度学习、图表征学习(图表示学习)或几何深度学习,是机器学习特别是深度学习领域增长最快的研究课题。本次分享的题目为《GNN的基础、前沿和应用》,主要介绍由吴凌飞、崔鹏、裴健、赵亮几位学者牵头编撰的综合性书籍《图神经网络基础、前沿与应用》中的大致内容。一、图神经网络的介绍1、为什么要研究图?图是一种描述和建模复杂系统的通用语言。图本身并不复杂,它主要由边和结点构成。我们可以用结点表示任何我们想要建模的物体,可以用边表示两

当前主流的AI芯片主要分为三类,GPU、FPGA、ASIC。GPU、FPGA均是前期较为成熟的芯片架构,属于通用型芯片。ASIC属于为AI特定场景定制的芯片。行业内已经确认CPU不适用于AI计算,但是在AI应用领域也是必不可少。 GPU方案GPU与CPU的架构对比CPU遵循的是冯·诺依曼架构,其核心是存储程序/数据、串行顺序执行。因此CPU的架构中需要大量的空间去放置存储单元(Cache)和控制单元(Control),相比之下计算单元(ALU)只占据了很小的一部分,所以CPU在进行大规模并行计算

在我的世界(Minecraft)中,红石是一种非常重要的物品。它是游戏中的一种独特材料,开关、红石火把和红石块等能对导线或物体提供类似电流的能量。红石电路可以为你建造用于控制或激活其他机械的结构,其本身既可以被设计为用于响应玩家的手动激活,也可以反复输出信号或者响应非玩家引发的变化,如生物移动、物品掉落、植物生长、日夜更替等等。因此,在我的世界中,红石能够控制的机械类别极其多,小到简单机械如自动门、光开关和频闪电源,大到占地巨大的电梯、自动农场、小游戏平台甚至游戏内建的计算机。近日,B站UP主@

当风大到可以把伞吹坏的程度,无人机却稳稳当当,就像这样:御风飞行是空中飞行的一部分,从大的层面来讲,当飞行员驾驶飞机着陆时,风速可能会给他们带来挑战;从小的层面来讲,阵风也会影响无人机的飞行。目前来看,无人机要么在受控条件下飞行,无风;要么由人类使用遥控器操作。无人机被研究者控制在开阔的天空中编队飞行,但这些飞行通常是在理想的条件和环境下进行的。然而,要想让无人机自主执行必要但日常的任务,例如运送包裹,无人机必须能够实时适应风况。为了让无人机在风中飞行时具有更好的机动性,来自加州理工学院的一组工

1 什么是对比学习1.1 对比学习的定义1.2 对比学习的原理1.3 经典对比学习算法系列2 对比学习的应用3 对比学习在转转的实践3.1 CL在推荐召回的实践3.2 CL在转转的未来规划1 什么是对比学习1.1 对比学习的定义对比学习(Contrastive Learning, CL)是近年来 AI 领域的热门研究方向,吸引了众多研究学者的关注,其所属的自监督学习方式,更是在 ICLR 2020 被 Bengio 和 LeCun 等大佬点名称为 AI 的未来,后陆续登陆 NIPS, ACL,

本文由Cristian Bodnar 和Fabrizio Frasca 合著,以 C. Bodnar 、F. Frasca 等人发表于2021 ICML《Weisfeiler and Lehman Go Topological: 信息传递简单网络》和2021 NeurIPS 《Weisfeiler and Lehman Go Cellular: CW 网络》论文为参考。本文仅是通过微分几何学和代数拓扑学的视角讨论图神经网络系列的部分内容。从计算机网络到大型强子对撞机中的粒子相互作用,图可以用来模

OTO 是业内首个自动化、一站式、用户友好且通用的神经网络训练与结构压缩框架。 在人工智能时代,如何部署和维护神经网络是产品化的关键问题考虑到节省运算成本,同时尽可能小地损失模型性能,压缩神经网络成为了 DNN 产品化的关键之一。DNN 压缩通常来说有三种方式,剪枝,知识蒸馏和量化。剪枝旨在识别并去除冗余结构,给 DNN 瘦身的同时尽可能地保持模型性能,是最为通用且有效的压缩方法。三种方法通常来讲可以相辅相成,共同作用来达到最佳的压缩效果。然而现存的剪枝方法大都只针对特定模型,特定任务,且需要很

AI面部识别领域又开辟新业务了?这次,是鉴别二战时期老照片里的人脸图像。近日,来自谷歌的一名软件工程师Daniel Patt 研发了一项名为N2N(Numbers to Names)的 AI人脸识别技术,它可识别二战前欧洲和大屠杀时期的照片,并将他们与现代的人们联系起来。用AI寻找失散多年的亲人2016年,帕特在参观华沙波兰裔犹太人纪念馆时,萌生了一个想法。这一张张陌生的脸庞,会不会与自己存在血缘的联系?他的祖父母/外祖父母中有三位是来自波兰的大屠杀幸存者,他想帮助祖母找到被纳粹杀害的家人的照


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

SublimeText3漢化版
中文版,非常好用

EditPlus 中文破解版
體積小,語法高亮,不支援程式碼提示功能

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器