단백질은 생명의 초석이며 거의 모든 생물학적 과정에 참여합니다. 단백질이 어떻게 상호작용하는지 이해하는 것은 세포 기능의 복잡성을 설명하는 데 중요합니다.
2. 새로운 방법: 상호 작용하는 단백질 서열 결합
EPFL(Ecole Polytechnique Fédérale de Lausanne)의 Anne-Florence Bitbol 팀은 상호 작용하는 단백질 서열을 결합하는 방법을 제안했습니다. 이 방법은 다중 서열 정렬에 대해 훈련된 단백질 언어 모델의 힘을 활용합니다.
3. 방법의 장점
이 방법은 소규모 데이터 세트에 적합하며 지도 방법을 통해 단백질 복합체의 구조 예측을 향상시킬 수 있습니다.
4. 연구 결과 발표
연구 제목은 "마스킹된 언어 모델링을 이용한 상호작용 단백질 서열 결합"이며, 2024년 6월 24일 "PNAS"에 게재되었습니다.
단백질-단백질 상호 작용 예측단백질-단백질 상호 작용은 세포 기능에 중요하며 신호 전달의 특이성과 분자 모터 또는 수용체와 같은 다중 단백질 복합체의 형성을 보장합니다. 단백질-단백질 상호작용과 그 복잡한 구조를 예측하는 것은 컴퓨터 생물학과 생물물리학에서 중요한 주제입니다.
AlphaFold와 같은 딥러닝 방법이 단백질 단량체 구조 예측에서 상당한 진전을 이루었지만 복잡한 구조의 예측 성능은 여전히 단량체 예측만큼 좋지 않으며 이질성이 있습니다. AlphaFold는 먼저 쿼리 단백질 서열의 상동 다중 서열 정렬(MSA)을 구성하며 MSA의 품질은 예측 정확도에 매우 중요합니다.
이종고분자의 쌍 MSA
다중 사슬을 포함하는 단백질 복합체(이종다량체)의 경우 쌍 MSA는 상호작용 파트너 간의 공진화 정보를 제공하고 사슬간 접촉을 추론하는 데 도움이 될 수 있지만, 특히 진핵생물에서는 올바르게 쌍을 이루는 MSA를 구성하는 것이 어렵습니다. 상동성 단백질이 많으며 게놈 근접성에 의존하지 않습니다.
공진화 방법
현재 이러한 문제를 해결하기 위해 게놈 근접성, 근사 상동성, 계통 발생 기반 방법 및 공진화 전략이 결합되어 있습니다. 그 중 공진화 방법에는 대용량 데이터가 필요하지만, 아직 최적화 단계입니다. 특히 공진화 신호를 최대화하여 상동 단백질을 일치시킴으로써 복잡한 구조를 페어링하고 예측하는 잠재력을 보여줍니다.
DiffPALM: 미분 가능한 페어링 방법
EPFL의 Anne-Florence Bitbol 팀은 다중 서열 정렬(MSA)에 대해 훈련된 단백질 언어를 활용하는 상호 작용하는 단백질 서열을 페어링하는 방법을 개발했습니다. MSA Transformer 및 AlphaFold의 EvoFormer 모듈. 이를 통해 단백질 간의 복잡한 상호작용을 높은 정확도로 이해하고 예측할 수 있습니다.
이를 바탕으로 연구원들은 MLM을 사용하여 동족 단어 일치를 예측하는 미분 가능한 방법인 DiffPALM(Alignment-Based Language Model)을 사용한 Differentiable pairing을 제안했습니다.
그래픽: 소형 HK-RR MSA의 DiffPALM 성능. (출처: 논문)DiffPALM은 유비쿼터스 원핵 단백질 데이터 세트에서 추출한 얕은 MSA의 어려운 벤치마크에서 기존 공진화 방법보다 훨씬 뛰어난 성능을 발휘합니다. 알려진 상호 작용 쌍이 예로 제공되면 DiffPALM 성능이 더욱 빠르게 향상됩니다.
공진화에 기반한 페어링 방법 단백질 서열이 긴밀하게 상호작용할 때 시간이 지남에 따라 어떻게 함께 진화하는지 연구하는 데 중점을 둡니다. 한 단백질의 변화는 상호작용하는 분자의 변화로 이어질 수 있습니다. 이는 분자 및 세포 생물학에서 매우 중요한 주제이며 MSA에서 훈련된 단백질 언어 모델에 의해 잘 포착됩니다.
그래픽: 다양한 페어링 방법을 사용한 AFM 성능. (출처: 논문)그런 다음 팀은 진핵생물 단백질 복합체의 상동체 매칭 퍼즐에 DiffPALM을 적용했습니다. 이를 위해 연구진은 DiffPALM 쌍 시퀀스를 AFM의 입력으로 사용했습니다. 테스트된 복합체에서 DiffPALM을 사용하면 경우에 따라 AFM의 구조 예측이 크게 향상되었습니다. 또한 직교 기반 페어링을 사용하는 것과 비슷한 성능을 달성합니다.
그림: 긍정적인 예, MSA 깊이 및 다른 단백질 계열 쌍으로의 확장의 영향. (출처: 종이)DiffPALM의 응용은 기본 단백질 생물학 분야에서 명백하지만 의학 연구 및 약물 개발에서 강력한 도구가 될 수 있는 잠재력을 가지고 있기 때문에 그 응용 범위를 넘어 확장됩니다. 예를 들어, 단백질 상호작용을 정확하게 예측하면 질병 메커니즘을 이해하고 표적 치료법을 개발하는 데 도움이 될 수 있습니다.
연구원들은 DiffPALM을 무료로 사용할 수 있게 만들었으며 과학계의 광범위한 채택으로 컴퓨터 생물학이 더욱 발전하고 연구자들이 단백질 상호 작용의 복잡성을 탐구할 수 있기를 바랍니다.
DiffPALM은 고급 기계 학습 기술과 복잡한 생물학적 데이터의 효율적인 처리를 결합하여 계산 생물학의 중요한 발전을 이룹니다.
그것은 과학자들의 단백질 상호 작용에 대한 이해를 향상시킬 뿐만 아니라 의학 연구의 새로운 길을 열어 잠재적으로 질병 치료 및 약물 개발의 획기적인 발전을 가져올 수 있습니다.
논문 링크:
https://www.pnas.org/doi/10.1073/pnas.2311887121
관련 보고서:
https://phys.org/news/2024-06-ai-based-approach-단백질 -interaction.html
위 내용은 AlphaFold에 필적하는 정확도로 EPFL의 AI 방법은 서열의 단백질 상호 작용을 일치시킵니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!