당류는 자연에 가장 풍부한 유기물질이자 생명에 필수적인 물질입니다. 생리학적 및 병리학적 과정에서 탄수화물이 단백질을 어떻게 조절하는지 이해하면 주요 생물학적 문제를 해결하고 새로운 치료법을 개발할 수 있는 기회를 얻을 수 있습니다.
그러나 설탕 분자의 다양성과 복잡성으로 인해 설탕-단백질 결합 및 상호 작용 부위를 실험적으로 식별하는 데 어려움이 있습니다.
여기서 중국과학원 팀은 주어진 단백질 구조에서 당 결합 부위를 정확하게 예측할 수 있는 딥 러닝 모델인 DeepGlycanSite를 개발했습니다.
DeepGlycanSite는 Transformer 아키텍처를 사용하여 단백질의 기하학적 및 진화적 특성을 심층 등변 그래프 신경망에 통합합니다. 그 성능은 이전 고급 방법을 훨씬 능가하며 다양한 설탕 분자의 결합 위치를 효과적으로 예측할 수 있습니다.
돌연변이 유발 연구와 결합하여 DeepGlycanSite는 중요한 G 단백질 결합 수용체의 구아노신-5'-이인산 인식 부위를 밝혀줍니다.
이러한 발견은 당 결합 부위 예측을 위한 DeepGlycanSite의 가치를 입증하고 치료적으로 중요한 단백질의 당 조절 뒤에 있는 분자 메커니즘에 대한 통찰력을 제공할 수 있습니다.
이 연구의 제목은 "DeepGlycanSite를 통한 매우 정확한 탄수화물 결합 부위 예측"이며 2024년 6월 17일 "Nature Communications"에 게재되었습니다.
설탕은 모든 유기체의 세포 표면 어디에나 존재합니다. 설탕은 렉틴, 항체, 효소 및 수송체와 같은 다양한 단백질 계열과 상호 작용하여 면역 반응, 세포 분화 및 신경 발달과 같은 주요 생물학적 과정을 조절합니다. 탄수화물과 단백질의 상호작용 메커니즘을 이해하는 것은 탄수화물 의약품 개발의 기초입니다.
그러나 탄수화물 구조의 다양성과 복잡성, 특히 단백질과의 결합 부위의 다양성으로 인해 실험 데이터 수집 및 약물 설계에 어려움이 있습니다.
그림: 설탕 분자의 복잡성과 설탕 결합 부위의 다양성. (출처: 논문)
과거에는 전통적인 결합 위치 예측 방법은 구조가 복잡하고 크기 변화가 큰 설탕 분자에는 적합하지 않았습니다. 이는 고해상도 당-단백질 복합 구조 데이터의 부족과 결합되어 예측 모델의 성능을 제한합니다.
최근 몇 년 동안 단백질 데이터 뱅크(PDB)의 급속한 발전과 공개 글리코믹스 자원으로 인해 학계에서는 이러한 복합체의 구조 데이터가 19,000개 이상 축적되었습니다. 이러한 고품질 데이터의 증가로 인해 AI 기술을 사용하여 정확한 당 결합 부위 예측 모델을 개발할 수 있게 되었으며, 이는 설탕 약물의 발견 및 최적화 프로세스를 가속화할 것으로 예상됩니다.
최근 연구에서 중국과학원 팀은 표적 단백질 구조로 당 결합 부위를 정확하게 예측할 수 있는 심층 등변 그래프 신경망(EGNN) 모델인 DeepGlycanSite를 도입했습니다.
그림: DeepGlycanSite 개요. (출처: 논문)
팀은 잔류물 내 및 잔류물 사이의 방향 및 거리와 같은 기하학적 특징과 진화 정보를 활용하여 단백질을 DeepGlycanSite의 잔류물 수준 그래픽 표현으로 제시했습니다. Self-Attention 메커니즘을 갖춘 Transformer 블록과 결합하여 특징 추출 및 복잡한 관계 발견을 향상합니다.
연구원들은 100개 이상의 고유한 당 결합 단백질이 포함된 독립적인 테스트 세트에서 DeepGlycanSite를 현재의 최첨단 계산 방법과 비교했습니다.
결과에 따르면 DeepGlycanSite의 평균 Matthews 상관 계수(MCC)(0.625)는 StackCBPred(0.018)의 30배 이상이며 다른 시퀀스 기반 예측 방법을 훨씬 능가합니다.
기존의 리간드 결합 부위 방법은 소수성 또는 작은 크기로 인해 단순 설탕 분자의 결합 부위를 제외할 수 있지만 DeepGlycanSite는 이러한 부위를 효과적으로 식별할 수 있습니다.
그림: 다양한 설탕 결합 부위를 예측하는 모델 성능 비교. (출처: 논문)
또한 DeepGlycanSite는 단백질의 여러 당 결합 부위를 예측하는 데에도 탁월한 성능을 발휘하며, 이는 다가 당접합체가 당-단백질 상호 작용 및 생물학적 과정의 조절에 어떻게 영향을 미치는지 이해하는 데 큰 가치가 있습니다. 예를 들어, 다가 당접합체는 설탕 분자와 렉틴 사이의 상호 작용에 영향을 미치는 화학적 도구 및 약물 후보로 설계되었습니다.
DeepGlycanSite는 단백질 서열이나 구조 정보만 이용하는 기존 방식과 달리, 우수한 성능의 핵심 요소가 될 수 있는 단백질의 기하학적 정보와 진화적 특성을 충분히 고려합니다.
또한 쿼리 설탕 분자의 화학 구조를 바탕으로 DeepGlycanSite는 특정 결합 부위를 예측할 수 있습니다.
그림: 설탕의 특정 결합 부위에 대한 예측을 쿼리합니다. (출처: 논문)
연구원들은 기능적으로 중요한 G 단백질 결합 수용체(GPCR)에 DeepGlycanSite를 적용하는 방법을 조사했습니다. DeepGlycanSite는 AlphaFold2가 예측한 단백질 구조와 탄수화물 화학 구조를 사용하여 인간 P2Y14에서 GDP-Fuc의 특정 결합 부위를 성공적으로 감지했습니다.
AlphaFold2의 예측된 측쇄의 품질은 개선되어야 하지만 DeepGlycanSite는 단백질 구조 정확도에 덜 의존하고 예측된 단백질 구조를 사용하여 당-단백질 상호 작용에 대한 통찰력을 제공할 수 있습니다.
요약하자면, 독립적인 테스트 세트와 시험관 내 사례 연구에서 DeepGlycanSite의 검증은 이것이 당 결합 부위 예측을 위한 효과적인 도구임을 보여줍니다. 연구자들은 DeepGlycanSite를 사용하여 표적 단백질의 당 결합 포켓을 예측함으로써 당-단백질 상호 작용에 대한 이해를 높일 수 있습니다.
당류는 생물학적 기능에서 핵심적인 역할을 합니다. DeepGlycanSite는 설탕 분자와 설탕 결합 단백질의 생물학적 기능을 분석하는 데 도움이 될 뿐만 아니라 설탕 약물 개발을 위한 강력한 도구도 제공합니다.
논문 링크:https://www.nature.com/articles/s41467-024-49516-2
위 내용은 중국과학원팀의 Transformer 딥러닝 모델은 기존 방법보다 30배 더 높은 당-단백질 상호작용 위치를 예측합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!