首頁  >  文章  >  科技週邊  >  僅幾秒,準確推斷蛋白動力學訊息,山大、北理工等AI模型RMSF-net登Nature子刊

僅幾秒,準確推斷蛋白動力學訊息,山大、北理工等AI模型RMSF-net登Nature子刊

王林
王林原創
2024-07-10 14:55:00727瀏覽

僅幾秒,準確推斷蛋白動力學訊息,山大、北理工等AI模型RMSF-net登Nature子刊

編輯 | KX

蛋白質的動力學對於理解其機制至關重要。然而,透過計算預測蛋白質動學資訊具有挑戰性。

在此,來自山東大學、百圖生科(BioMap)、北京理工大學、湖北醫藥學院、寧夏醫科大學和阿卜杜拉國王科技大學(KAUST)的研究團隊,提出了一個神經網路模型RMSF -net,其優於以前的方法,並在大規模蛋白質動力學數據集中產生最佳結果;該模型可以在幾秒鐘內準確推斷出蛋白質的動力學資訊。

透過從實驗蛋白質結構資料和低溫電子顯微鏡(cryo-EM) 資料整合中有效地學習,該方法能夠準確識別低溫電子顯微鏡圖和PDB 模型之間的互動式雙向約束和監督,以最大限度地提高動力學預測效率。

RMSF-net 是一個可免費使用的工具,將在蛋白質動力學研究中發揮重要作用。

研究以「Accurate Prediction of Protein Structural Flexibility by Deep Learning Integrating Intricate Atomic Structures and Cryo-EM Density Information」為題,於 7 月 2 日發佈在《Nature Communications》。

僅幾秒,準確推斷蛋白動力學訊息,山大、北理工等AI模型RMSF-net登Nature子刊

論文連結:
  • https://www.nature.com/articles/s41467-024-49858-x

. com/XintSong/RMSF-net

  • 蛋白質動力學

蛋白質動力學在理解其機制中至關重要。低溫電子顯微鏡 (cryo-EM) 技術可解析大多數蛋白質,其中大分子結構由 3D 密度圖表示。

低溫電子顯微鏡的限制

由於原始二維粒子影像的分辨率和信噪比較低,低溫電子顯微鏡分析無法在重建過程中分辨出微小的構象變化。

深度學習在低溫電子顯微鏡的應用

深度學習方法廣泛用於低溫電子顯微鏡圖的自動分析。利用高解析度的低溫電子顯微鏡圖譜,可以從低溫電子顯微鏡圖譜建立蛋白質資料庫 (PDB) 模型。

RMSF-net 概述

RMSF-net 是一種神經網路模型,用於低溫電子顯微鏡密度圖。它利用低溫電子顯微鏡密度和 PDB 模型訊息,可以在幾秒鐘內準確推斷蛋白質的動力學資訊。

RMSF

RMSF 是一種廣泛使用的測量方法,用於評估分子動力學 (MD) 分析中分子結構的靈活性。其主要目的是預測蛋白質內局部結構 (殘基、原子) 的 RMSF。

圖示:RMSF-net。 (資料來源:論文)

除了低溫電子顯微鏡圖之外,RMSF-net 還利用 PDB 模型作為額外輸入,以產生非常接近 MD 模擬結果的 RMSF 預測。 僅幾秒,準確推斷蛋白動力學訊息,山大、北理工等AI模型RMSF-net登Nature子刊

RMSF-net 是一種三維卷積神經網絡,包含兩個相互連接的模組。主模組採用 Unet + (L3) 架構對輸入密度框進行特徵編碼和解碼。另一個模組利用 1x1 卷積對 Unet + 主幹產生的特徵圖的通道進行回歸。然後將中心裁剪應用於回歸模組輸出以獲得中心 RMSF 子框,其中體素(voxel)值對應於其中包含的原子的 RMSF。最後,使用合併演算法將 RMSF 子框在空間上合併為 RMSF 圖。

此外,研究人員還建立了一個大規模蛋白質動力學資料集用於 RMSF-net 的訓練和驗證,其中選擇了 335 個具有擬合 PDB 模型的低溫電子顯微鏡結構條目並執行相應的 MD 模擬。綜合實驗結果證明了 RMSF-net 的效率和有效性。

表:不同 RMSF 預測方法在資料集上的表現。 (資料來源:論文)

動力學預測的準確性

僅幾秒,準確推斷蛋白動力學訊息,山大、北理工等AI模型RMSF-net登Nature子刊

RMSF-net 在嚴格的 5 倍交叉驗證中表現出色,與 MD 模擬結果的相關係數達到 0.746±0.127。與 DEFMap 相比,RMSF-net 的相關係數提高了 15%,與基準方法相比,提高了 10%。 動力學預測的可解釋性

研究人員透過對比實驗增強了 RMSF-net 動力學預測的可解釋性。他們將 RMSF 預測過程分為兩個步驟:

  1. 구조 정보 추출(Occ2RMSF-net)
  2. 추출된 구조 정보를 기반으로 한 운동학 예측

연구 결과에 따르면 저온 전자 현미경 스펙트럼(예: DEFMap 또는 RMSF-net_cryo)을 기반으로 한 모델의 역학 예측은 주로 다음과 같은 방식으로 이루어집니다. 단백질 구조 구현 해석. 이는 구조-기능 관계의 첫 번째 원칙과 일치하는 단백질 토폴로지와 역학 간의 연결을 강조합니다.

僅幾秒,準確推斷蛋白動力學訊息,山大、北理工等AI模型RMSF-net登Nature子刊

그림: RMSF-net 및 기타 관련 방법의 성능 비교. (출처: 논문)

또한 RMSF-net_cryo, RMSF-net_pdb 및 최종 이중 조합 RMSF-net의 포괄적인 비교를 통해 다음이 입증되었습니다. 한편으로는 PDB 모델의 구조 정보가 재생됩니다. 심층 모델이 MD 시뮬레이션에서 구조적 토폴로지와 유연성 사이의 패턴을 학습하는 RMSF-net 역할의 주요 역할, 반면에 모델은 저온 전자 현미경의 이종 밀도 분포에 포함된 운동 정보에 의해 더욱 향상됩니다. 지도. 이러한 결과는 RMSF-net의 단백질 역학 예측에 대한 저온 EM 맵 및 PDB 모델 정보의 보완적인 역할을 검증합니다.

제한 사항 및 향후 방향

RMSF-net이 주로 용액 내 순수 단백질과 그 복합체의 유연성을 예측하는 데 제한된다는 것은 부인할 수 없습니다. 이 방법은 소분자 리간드에 결합되거나 막 환경에서 단백질의 동적 특성과 관련하여 특정 국소 영역에서 부정확성을 나타낼 수 있습니다.

RMSF-net의 뛰어난 성능은 이 방향에 대한 추가 연구의 타당성을 보여줍니다. 이 연구는 핵산과 단백질-핵산 복합체로 확장되지 않았습니다. 다중 구조 예측 및 전이 분석을 포함하여 거대분자 역학의 모든 측면에 대한 포괄적인 특성화에는 향후 더욱 광범위하고 심층적인 연구가 필요합니다.

그럼에도 불구하고, RMSF-net은 단백질 역학 예측 도구로서 뛰어난 성능과 초고속 처리 속도로 인해 단백질 구조 및 역학 연구에 여전히 큰 응용 가능성을 가지고 있습니다.

참고: 표지는 인터넷에서 가져온 것입니다

以上是僅幾秒,準確推斷蛋白動力學訊息,山大、北理工等AI模型RMSF-net登Nature子刊的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn