理解蛋白質功能並開發分子療法,需要確定蛋白質發揮作用的細胞類型,並解析蛋白質之間的相互作用。
然而,對跨生物背景的蛋白質相互作用進行建模,對於現有的演算法而言仍然具有挑戰性。
在最新的研究中,哈佛醫學院的研究人員開發了 PINNACLE,這是一種產生情境感知蛋白質表徵的幾何深度學習方法。
PINNACLE 利用多器官單細胞圖譜,在情境化蛋白質相互作用網絡上進行學習,從 24 種組織的 156 種細胞類型情境中生成了 394,760 種蛋白質表徵。
研究以「Contextual AI models for single-cell protein biology」為題,於 2024 年 7 月 22 日發表在《Nature Methods》。
蛋白質功能與網絡上下文相關蛋白質功能
單細胞基因表現與蛋白質網絡
PINNACLE 模型
圖示:PINNACLE 概覽。 (資料來源:論文)
2. 情境化蛋白質表徵
PINNACLE 在整合的情境感知PPI 網絡上進行訓練,並輔以捕獲細胞相互作用和組織層次的網絡,產生針對細胞類型定制的蛋白質表徵。
3. 多尺度表示
與上下文無關的模型不同,PINNACLE 為每種蛋白質產生多種表示,取決於其細胞類型上下文。此外,PINNACLE 也產生細胞類型上下文和組織層次的表示。
4. 多尺度學習
PINNACLE 透過優化統一的潛在表示空間來學習蛋白質、細胞類型和組織的拓撲結構。
5. 上下文感知模型
PINNACLE 將上下文特定數據整合到一個模型中,並且在蛋白質、細胞類型和組織級數據之間傳遞知識。
6. 嵌入空間
為了將細胞和組織訊息注入嵌入空間,PINNACLE 採用蛋白質、細胞類型和組織層面的注意力。
7. 物理交互映射
物理上相互作用的蛋白質對在嵌入空間中緊密嵌入。
8. 細胞類型環境
蛋白質嵌入在它們的細胞類型環境附近。
9. 圖神經網路傳播
PINNACLE 使用針對每個節點和邊緣類型定制的注意力機制在蛋白質、細胞類型和組織之間傳播訊息。
圖示:PINNACLE 蛋白質嵌入區域的富集。 (資料來源:論文)蛋白質級預訓練任務考慮對蛋白質交互作用進行自監督連結預測和對蛋白質節點進行細胞類型分類。這些任務使 PINNACLE 能夠塑造一個嵌入空間,該空間封裝了上下文感知蛋白質相互作用網絡的拓撲結構和蛋白質的細胞類型身份。以上是產生394,760種蛋白質表徵,哈佛團隊開發AI模型,全面理解蛋白質情境的詳細內容。更多資訊請關注PHP中文網其他相關文章!