醣類是自然界中最豐富的有機物質,對生命至關重要。了解醣類如何在生理和病理過程中調節蛋白質,可以為解決關鍵的生物學問題和開發新的治療方法提供機會。
然而,醣類分子的多樣性和複雜性,對實驗識別糖-蛋白質結合以及相互作用的位點提出了挑戰。
在這裡,中國科學院團隊開發了一種深度學習模型 DeepGlycanSite,它能夠準確預測給定蛋白質結構上的糖結合位點。
DeepGlycanSite 將蛋白質的幾何和進化特徵融入具有 Transformer 架構的深度等變圖神經網路中,其性能顯著超越了先前的先進方法,並能有效預測各種醣類分子的結合位點。
結合誘變研究,DeepGlycanSite 揭示了重要 G 蛋白偶聯受體的鳥苷-5'-二磷酸糖辨識位點。
這些發現表明 DeepGlycanSite 對於糖結合位點預測具有重要價值,並且可以深入了解具有治療重要性蛋白質的醣類調節背後的分子機制。
研究以「Highly accurate carbohydrate-binding site prediction with DeepGlycanSite」為題,於 2024 年 6 月 17 日發佈在《Nature Communications》。
糖在所有生物體的細胞表面普遍存在,它們與多種蛋白質家族如凝集素、抗體、酶和轉運蛋白相互作用,調節免疫反應、細胞分化和神經發育等關鍵生物學過程。理解醣類與蛋白質的相互作用機制是開發醣類藥物的基礎。
然而,醣類結構的多樣性和複雜性,尤其是它們與蛋白質結合位點的多變性,給實驗數據的獲取和藥物設計帶來了挑戰。
圖示:醣類分子的複雜性和醣結合位點的多樣性。 (資料來源:論文)
過去,傳統的結合位點預測方法不適用於結構複雜、大小變化大的醣類分子。加上高分辨率糖-蛋白質複合物結構數據的稀缺,導致預測模型的性能受限。
近年來,隨著蛋白質資料庫(PDB)和開放性糖組學資源的快速發展,學界已經累積了超過 19,000 個此類複合物的結構數據。這些高品質數據的增加,為採用 AI 技術開發精確的糖結合位點預測模型提供了可能,從而有望加速醣類藥物的發現和優化過程。
在最新的研究中,中國科學院團隊引入了 DeepGlycanSite,這是一種深度等變圖神經網路 (EGNN) 模型,能夠準確預測具有目標蛋白質結構的糖結合位點。
圖示:DeepGlycanSite 概述。 (資料來源:論文)
該團隊利用幾何特徵(例如殘基內和殘基間的方向和距離)以及進化信息,在 DeepGlycanSite 中以殘基級別的圖形表示形式呈現蛋白質。結合具有自註意力機制的 Transformer 區塊來增強特徵提取和複雜關係發現。
在涉及一百多種獨特糖結合蛋白的獨立測試集上,研究人員將 DeepGlycanSite 與目前最先進的計算方法進行了比較。
結果顯示,DeepGlycanSite (0.625) 的平均馬修斯相關係數(MCC) 是 StackCBPred (0.018) 的 30 倍以上,同時遠超其他序列基礎的預測方法。
傳統配體結合位點方法可能因疏水性或小尺寸而排除簡單醣類分子的結合位點,而 DeepGlycanSite 則能有效識別這些位點。
圖示:比較模型在預測不同糖結合位點的表現。 (資料來源:論文)
並且,DeepGlycanSite 在預測蛋白質上的多個糖結合位點方面也表現出色,這對於理解多價糖綴合物如何影響糖-蛋白相互作用以及生物過程的調控具有重要價值。例如,多價糖綴合物被設計成化學工具和藥物候選物,以影響醣類分子與凝集素之間的相互作用。
與傳統的僅使用蛋白質序列或結構資訊的方法不同,DeepGlycanSite 充分考慮了蛋白質的幾何資訊及演化特性,這可能是其表現優異的關鍵因素。
此外,給定查詢醣類分子的化學結構,DeepGlycanSite 還可以預測其特定結合位點。
圖示:查詢糖的特定結合位點預測。 (資料來源:論文)
研究人員探索了 DeepGlycanSite 對功能重要的 G 蛋白偶聯受體 (GPCR) 的應用。利用 AlphaFold2 預測的蛋白質結構和醣類化學結構,DeepGlycanSite 成功檢測了人類 P2Y14 上 GDP-Fuc 的具體結合位點。
雖然 AlphaFold2 預測的側鏈品質有待提高,但 DeepGlycanSite 對蛋白質結構準確性的依賴較低,能夠使用預測的蛋白質結構提供糖-蛋白相互作用的見解。
綜上所述,DeepGlycanSite 在獨立測試集和體外案例研究中的驗證表明,它是一個有效的糖結合位點預測工具。研究人員可以利用 DeepGlycanSite 預測目標蛋白質上的糖結合口袋,從而促進對糖-蛋白質相互作用的理解。
醣類在生物學功能中扮演關鍵角色,DeepGlycanSite 不僅有助於解析醣類分子和醣結合蛋白的生物學功能,也為醣類藥物的開發提供了有力工具。
論文連結:https://www.nature.com/articles/s41467-024-49516-2
以上是比傳統方法高30倍,中國科學院團隊Transformer深度學習模型預測糖-蛋白質作用位點的詳細內容。更多資訊請關注PHP中文網其他相關文章!