>  기사  >  기술 주변기기  >  적은 양의 데이터로 높은 다양성 달성, KAIST, 약물 설계를 위한 3D 분자 생성을 위한 새로운 프레임워크 개발

적은 양의 데이터로 높은 다양성 달성, KAIST, 약물 설계를 위한 3D 분자 생성을 위한 새로운 프레임워크 개발

PHPz
PHPz앞으로
2024-04-02 21:30:011090검색

적은 양의 데이터로 높은 다양성 달성, KAIST, 약물 설계를 위한 3D 분자 생성을 위한 새로운 프레임워크 개발

Editor | Radish Skin

심층 생성 모델은 약물 설계를 가속화할 수 있는 큰 잠재력을 가지고 있습니다. 그러나 기존 생성 모델은 제한된 데이터로 인해 일반화 문제에 직면하는 경우가 많으며 결과적으로 덜 혁신적인 설계가 이루어집니다.

이러한 문제를 해결하기 위해 한국 KAIST 연구진은 타겟 결합 포켓 내에서 상호작용 기반 상호작용 설계를 가능하게 하는 상호작용 인식 3D 분자 생성 기능 프레임워크를 제안했습니다. 단백질-리간드 상호 작용의 일반적인 패턴을 사전 지식으로 활용함으로써 모델은 제한된 실험 데이터로 높은 수준의 일반성을 달성할 수 있습니다. 동시에, 상호 작용 목적을 위한 일반적인 패턴으로 단백질 질량-리간드 질량을 활용함으로써 모델은 일반성과 높은 특이성 사이의 적절한 균형을 달성할 수 있으며, 이는 약물 설계에 대한 일반성과 예측 가능성을 제공합니다.

생성된 보이지 않는 표적 리간드의 성능은 결합 포즈 확실성, 친화성, 다양성 및 신규성을 분석하여 종합적으로 평가되었습니다. 또한, 잠재적인 돌연변이 선택적 억제제의 효율적인 설계는 구조 기반 약물 설계에 대한 이러한 접근 방식의 적용 가능성을 보여줍니다.

이 연구의 제목은 "상호 작용 유도 약물 설계를 위한 3D 분자 생성 프레임워크"이며 2024년 3월 27일 "Nature Communications"에 게재되었습니다.

적은 양의 데이터로 높은 다양성 달성, KAIST, 약물 설계를 위한 3D 분자 생성을 위한 새로운 프레임워크 개발

데이터 캡처 및 과학적 문제에서 일반화 가능한 모델을 개발하려면 딥 러닝 모델에 대한 적절한 계층적 사전 지식이 중요합니다. 예를 들어 AlphaFold는 공진화 정보와 잔기 쌍 표현을 활용하여 단백질 구조를 성공적으로 예측합니다. 심층 생성 모델은 약물 설계 패러다임을 바꾸고 있지만 약물 분자에 대한 활성 데이터가 부족하여 성능이 제한되어 일반화 능력이 낮습니다. 심층 생성 모델의 성능을 향상하려면 약물 분자 활성 데이터의 일반화에 대한 적합성을 보장하기 위한 적절한 사전 지식이 필요하며, 이는 까다로운 화합물 구조 및 특성을 예측하는 데 중요합니다.

최근 생성 기능 모델은 활동 데이터에 의존하지 않고 구조 기반 리간드 설계를 위해 결합 부위의 3차원 구조를 활용하여 모델의 파형화 기능을 향상시킵니다. Well-waved 모델은 수소 결합, 염교, 소수성 상호 작용 및 π-π 스태킹을 포함한 단백질-리간드 상호 작용의 보편적인 특성을 이해해야 합니다. 이는 안정적인 결합 구조를 형성하고 높은 친화력을 유지하는 데 필수적입니다. 이러한 유비쿼터스 상호 작용 패턴은 강력한 약물 설계의 기초입니다.

이러한 상황을 바탕으로 KAIST 연구진은 상호작용 인식 3차원 분자 생성 프레임워크를 제안했습니다. 이 프레임워크는 단백질-리간드 상호작용의 보편적인 특성을 활용하여 구조 기반 약물 설계를 안내합니다. 프레임워크는 (1) 상호 작용 감지 조건 설정과 (2) 상호 작용하는 3D 분자 생성의 두 가지 주요 단계로 구성됩니다.

적은 양의 데이터로 높은 다양성 달성, KAIST, 약물 설계를 위한 3D 분자 생성을 위한 새로운 프레임워크 개발

그림: 프레임워크 개념 그림. (출처: 논문)

프레임워크의 첫 번째 단계는 주어진 결합 부위 P에 대한 단백질 원자를 연구하여 상호 작용 조건 I을 설정하는 것을 목표로 합니다. 연구진은 수소 결합, 염교, 소수성 상호작용, π-π 스태킹 등 네 가지 유형의 단백질-리간드 상호작용을 사용했습니다. 여기에서 연구자들은 단백질 데이터 뱅크(PDB)에서 가장 지배적인 4가지 상호 작용 유형만 고려했는데, 그 이유는 주로 모델 훈련을 위해 PDB에서 파생된 PDBbind 2020 데이터 세트를 사용했기 때문입니다.

동시에 팀은 단백질 원자 상호작용 감지 조절 전략을 개발했습니다. 연구진은 상호작용 조건을 단백질 원자 세트에 대한 추가 상호작용 유형의 원-핫 벡터로 정의합니다. 이는 원자가 특정 상호작용에 참여할 수 있는지 여부와 상호작용에서의 역할을 나타냅니다.

단백질 원자는 음이온, 양이온, 수소 결합 공여체 및 수용체, 방향족, 소수성 및 비상호작용 원자 등 7가지 범주 중 하나로 나뉩니다. 전체 상호 작용 정보를 단일 상호 작용 지문으로 표현하는 대신 팀의 전략은 상호 작용 조건을 로컬로 설정하는 것을 목표로 합니다.

이 연구에서 연구자들은 주로 두 가지 전략을 통해 가방 원자의 상호 작용 범주를 결정했습니다.

생성 단계에서는 수용체-리간드 상호 작용에 대한 정보가 항상 제공되지 않기 때문에 각 단백질 원자를 분석하여 상호 작용 조건을 지정하기 위해 상호 작용 범주에 대한 기준이 미리 정의되어 있습니다. 이 조건 설정을 비참조 상호 작용 조건이라고 합니다.

훈련 단계에서는 단백질-리간드 복합체의 실측 구조를 사용하여 상호 작용 조건을 추출합니다.

연구원들은 또한 리간드의 역공학을 위해 DeepICL이라는 심층 생성 모델을 제안했습니다. 이 모델은 포켓의 3차원 환경과 1단계 상호 작용 조건을 기반으로 리간드 내 원자를 점진적으로 생성합니다.

대상 포켓은 결합 리간드와 결합 자세에 따라 다양한 단백질-리간드 상호 작용 유형의 조합을 형성할 수 있지만, 팀의 목표는 DeepICL이라는 3D 조건부 생성 모델을 사용하여 특정 상호 작용을 만족하는 리간드를 역으로 설계하는 것입니다. 이 모델은 모든 유형의 단백질에 적용될 수 있습니다. 연구자들은 특정 포켓이나 리간드 구조에 대한 바람직하지 않은 편향을 방지하기 위해 전체 상호 작용 정보를 사용하는 대신 리간드가 결합해야 하는 하위 포켓의 로컬 상호 작용 조건을 사용합니다.

적은 양의 데이터로 높은 다양성 달성, KAIST, 약물 설계를 위한 3D 분자 생성을 위한 새로운 프레임워크 개발

그림: 상호 작용 인식 조건부 리간드 정교화의 예. (출처: 논문)

일반적인 구조 기반 약물 설계를 수행하는 프레임워크의 능력을 입증하기 위해 연구원들은 105~107개의 컴퓨터 생성 단백질-리간드 결합 구조로 구성된 일반적인 벤치마크를 사용하는 대신 PDBbind 데이터베이스의 데이터만 사용했습니다. 좋은 일반화 모델은 작은 규모의 데이터에서도 적절한 특징을 성공적으로 추출할 수 있기 때문에 104개의 실제 결정 구조를 선택했습니다.

적은 양의 데이터로 높은 다양성 달성, KAIST, 약물 설계를 위한 3D 분자 생성을 위한 새로운 프레임워크 개발

그림: 생성 프레임워크의 보편성. (출처: 논문)

연구원들은 생성된 보이지 않는 표적 리간드의 특성(결합 안정성, 친화력, 기하학적 패턴, 다양성 및 참신함)의 다양한 측면을 분석하여 모델을 평가했습니다.

적은 양의 데이터로 높은 다양성 달성, KAIST, 약물 설계를 위한 3D 분자 생성을 위한 새로운 프레임워크 개발

aIllustration: 부위별 상호작용을 통해 선택성을 조절하면 리간드 설계가 제어됩니다. (출처: 논문)

연구원들은 이 모델을 사용하여 특정 상호 작용 사이트가 중요한 역할을 하는 실제 문제를 해결하고 구조 기반 약물 설계에 대한 접근 방식의 적용 가능성을 입증했습니다.

논문 링크:https://www.nature.com/articles/s41467-024-47011-2

위 내용은 적은 양의 데이터로 높은 다양성 달성, KAIST, 약물 설계를 위한 3D 분자 생성을 위한 새로운 프레임워크 개발의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 jiqizhixin.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제