理解蛋白质功能并开发分子疗法,需要确定蛋白质发挥作用的细胞类型,并解析蛋白质之间的相互作用。
然而,对跨生物背景的蛋白质相互作用进行建模,对于现有的算法而言仍然具有挑战性。
在最新的研究中,哈佛医学院的研究人员开发了 PINNACLE,这是一种生成情境感知蛋白质表征的几何深度学习方法。
PINNACLE 利用多器官单细胞图谱,在情境化蛋白质相互作用网络上进行学习,从 24 种组织的 156 种细胞类型情境中生成了 394,760 种蛋白质表征。
该研究以「Contextual AI models for single-cell protein biology」为题,于 2024 年 7 月 22 日发表在《Nature Methods》中。
蛋白质功能与网络上下文相关蛋白质功能
单细胞基因表达与蛋白质网络
PINNACLE 模型
图示:PINNACLE 概览。(来源:论文)
2. 情境化蛋白质表征
PINNACLE 在集成的情境感知 PPI 网络上进行训练,并辅以捕获细胞相互作用和组织层次的网络,生成针对细胞类型定制的蛋白质表征。
3. 多尺度表示
与上下文无关的模型不同,PINNACLE 为每种蛋白质生成多种表示,取决于其细胞类型上下文。此外,PINNACLE 还生成细胞类型上下文和组织层次的表示。
4. 多尺度学习
PINNACLE 通过优化统一的潜在表示空间来学习蛋白质、细胞类型和组织的拓扑结构。
5. 上下文感知模型
PINNACLE 将上下文特定数据集成到一个模型中,并且在蛋白质、细胞类型和组织级数据之间传递知识。
6. 嵌入空间
为了将细胞和组织信息注入嵌入空间,PINNACLE 采用蛋白质、细胞类型和组织水平的注意力。
7. 物理交互映射
物理上相互作用的蛋白质对在嵌入空间中紧密嵌入。
8. 细胞类型环境
蛋白质嵌入在它们的细胞类型环境附近。
9. 图神经网络传播
PINNACLE 使用针对每个节点和边缘类型定制的注意力机制在蛋白质、细胞类型和组织之间传播信息。
图示:PINNACLE 蛋白质嵌入区域的富集。(来源:论文)蛋白质级预训练任务考虑对蛋白质相互作用进行自监督链接预测和对蛋白质节点进行细胞类型分类。这些任务使 PINNACLE 能够塑造一个嵌入空间,该空间封装了上下文感知蛋白质相互作用网络的拓扑结构和蛋白质的细胞类型身份。以上是生成394,760种蛋白质表征,哈佛团队开发AI模型,全面理解蛋白质上下文的详细内容。更多信息请关注PHP中文网其他相关文章!