>기술 주변기기 >일체 포함 >Peking University & Wangshi Intelligence는 화학 반응 사전 훈련과 조건부 분자 생성 간의 격차를 해소하는 새로운 모델을 제안합니다!

Peking University & Wangshi Intelligence는 화학 반응 사전 훈련과 조건부 분자 생성 간의 격차를 해소하는 새로운 모델을 제안합니다!

WBOY
WBOY앞으로
2023-12-14 20:04:20586검색

화학반응은 약물설계와 유기화학 연구의 기초입니다. 화학 반응의 기본 규칙을 효과적으로 포착할 수 있는 대규모 딥 러닝 프레임워크에 대한 연구 커뮤니티의 필요성이 커지고 있습니다.

최근 북경대학교 연구팀과 왕시 인텔리전스(Wangshi Intelligence) 연구팀은 반응 기반 분자 사전 훈련과 생성 작업 간의 격차를 해소할 수 있는 새로운 방법을 제안했습니다.

유기 화학의 메커니즘에서 영감을 받아 연구원들은 귀납적 편향을 모델에 통합할 수 있는 새로운 사전 훈련 프레임워크를 개발했습니다. 제안된 이 프레임워크는 까다로운 다운스트림 작업을 수행할 때 최첨단 결과를 달성합니다. 프레임워크는 화학 지식을 활용하여 소수의 반응 템플릿에 의존하는 현재 분자 생성 모델의 한계를 극복합니다. 광범위한 실험을 통해 이 모델은 고품질의 합성 가능한 약물 유사 구조를 생성했습니다.

전반적으로 이 연구는 다양한 반응 기반 응용 프로그램을 위한 대규모 딥 러닝 프레임워크를 향한 중요한 단계입니다.

연구 제목은 "통합 모델을 사용하여 화학 반응 사전 훈련과 조건부 분자 생성 사이의 격차 해소"라는 제목으로 2023년 12월 5일 "Nature Machine Intelligence"에 게재되었습니다.

Peking University & Wangshi Intelligence는 화학 반응 사전 훈련과 조건부 분자 생성 간의 격차를 해소하는 새로운 모델을 제안합니다!

논문 링크: https://www.nature.com/articles/s42256-023-00764-9

딥 러닝 모델은 많은 과학 연구 분야에서 널리 사용되었습니다. 사전 훈련 프레임워크는 새로운 작업을 원활하게 통합하는 데 긍정적인 역할을 하며, 특히 레이블이 지정된 데이터가 제한적인 경우 모델링 프로세스 속도를 높일 수 있습니다.

약물 설계 및 유기 화학 연구의 기초는 화학 반응입니다. 현재 데이터 마이닝의 연구와 적용을 통해 딥러닝 모델을 화학 반응에 사용할 수 있게 되었습니다. 이러한 데이터를 기반으로 화학 반응의 표현 학습을 탐구하는 데이터 기반 연구가 많이 있었습니다

표현 학습이란 데이터에서 유용한 기능을 자동으로 학습한 다음 이를 다양한 다운스트림 작업에 사용하는 것을 말합니다. 기존 방법은 유기화학의 기본 이론을 무시하여 성능이 제한되었습니다.

화학 반응을 기반으로 한 분자 생성

반응 분류 작업 외에도 화학 반응을 기반으로 한 분자 생성도 중요한 응용 분야입니다. 초기 연구에서는 템플릿 기반의 단계별 분자 생성 전략이 자주 채택되었습니다.

이러한 템플릿 기반 방법은 미리 정의된 빌딩 블록과 반응에 크게 의존하여 접근 가능한 화학 공간을 좁혔습니다. 템플릿 기반 방법을 복잡한 반응으로 추정할 수 없는 반응 생성물 예측 분야에서도 유사한 경향이 발견됩니다. 이 문제는 템플릿 없는 방법을 사용하여 해결할 수 있습니다.

반응 기반 분자 생성 작업에서 템플릿을 사용하지 않는 방법은 템플릿 기반 방법에 비해 일반화 장점도 보여줍니다. 그러나 기존의 템플릿이 없는 분자 생성 방법은 미리 정의된 반응물 라이브러리를 기반으로만 분자를 생성할 수 있습니다. 이 외에도 약물 설계의 납 화합물 또는 납 최적화 단계에서는 주어진 구조를 수정하기 위한 편집 도구로 화학 반응을 활용하는 것이 더 유리합니다. 생성된 화학 라이브러리는 더 적은 반응 단계로 합성할 수 있는 화학 공간의 하위 집합에 중점을 둡니다.

화학 반응을 위한 새롭고 포괄적인 딥 러닝 프레임워크

여기에서 연구원들은 Uni-RXN이라는 화학 반응을 위한 새롭고 포괄적인 딥 러닝 프레임워크를 제안합니다. 이는 자기 지도 표현 학습과 조건부 생성 모델링이라는 두 가지 기본 작업을 해결하는 것을 목표로 합니다.

Peking University & Wangshi Intelligence는 화학 반응 사전 훈련과 조건부 분자 생성 간의 격차를 해소하는 새로운 모델을 제안합니다!

쇼: Uni-RXN 구성 및 방법. (인용문: 논문)

기존 방법과 다르게 연구진은 화학 반응을 위해 특별히 설계된 일련의 자기 감독 작업을 제안했습니다. 이러한 작업에는 반응 중심 예측, 1차 반응물과 부반응물 페어링, 반응물-생성물 페어링이 포함됩니다. 까다로운 반응 작업에 대한 광범위한 평가에서 Uni-RXN 방법은 최첨단 기술을 능가하며 화학 반응에 대한 도메인 지식을 효과적으로 포착하는 능력을 입증했습니다. 얻은 유망한 결과는 광범위한 다운스트림 애플리케이션을 위한 길을 열었습니다

화학적 규칙을 효과적으로 포착함으로써 Uni-RXN은 생성 작업에 이상적으로 적합합니다. 미리 정의된 반응물 라이브러리에서 단편을 선택하는 기존 방법과 달리 Uni-RXN은 분자 구조를 입력 조건으로 사용하고 반응 내에서 순열 불변성을 유지하면서 해당 반응물의 표현을 생성합니다. Uni-RXN은 조밀한 벡터 유사성 검색 패키지의 강력한 기능을 활용하여 대규모 반응물 및 시약 라이브러리에서 반응물을 효율적으로 검색할 수 있습니다. 이어서, 반응 예측 모델을 사용하여 제품 출력을 생성합니다.

화학적 공간의 제한된 하위 집합만 탐색하는 템플릿 기반 방법과 비교할 때 Uni-RXN은 더 넓은 범위의 합성 가능한 약물 유사 구조를 생성하는 데 탁월한 성능을 나타냅니다. 이 기능은 가상 라이브러리 열거에 특히 적합하며 포괄적인 통계 분석 및 사례 연구를 통해 지원됩니다.

Uni-RXN 방법에는 많은 장점이 있으며 까다로운 화학 반응 분류 작업에 대한 풍부한 표현을 생성할 수 있습니다. 다른 기본 모델과 비교하여 Uni-RXN은 클래스당 4개의 데이터 포인트만으로 58.7%의 정확도를 달성합니다. 재작성된 내용: 화학 반응 분류의 정확도는 표 1에 나와 있습니다. (출처: 논문)

Transformer 모델을 사용하면 최적화된 화학 반응 데이터와 최적화되지 않은 화학 반응 데이터를 구별할 수 있습니다. 또한 구조적 조건 생성에도 인코더를 쉽게 적용할 수 있습니다Peking University & Wangshi Intelligence는 화학 반응 사전 훈련과 조건부 분자 생성 간의 격차를 해소하는 새로운 모델을 제안합니다!

다시 작성해야 할 내용은 다음과 같습니다. 차트는 Uni-RXN의 검색 성능과 주의 가중치를 보여줍니다. (출처: 논문) Peking University & Wangshi Intelligence는 화학 반응 사전 훈련과 조건부 분자 생성 간의 격차를 해소하는 새로운 모델을 제안합니다!

결과는 제안된 모델에 의해 생성된 분자의 유리한 특성을 강조하여 약물 발견 작업에 매우 적합합니다. 이 모델은 약물과 유사한 특성과 합성성을 갖춘 더 많은 분자를 생성할 수 있습니다

그림: Uni-RXNGen 프로세스 및 성능. (출처: 논문) Peking University & Wangshi Intelligence는 화학 반응 사전 훈련과 조건부 분자 생성 간의 격차를 해소하는 새로운 모델을 제안합니다!

생성된 모델은 분자 도킹과 같은 가상 스크리닝 방법과 결합하여 효율적인 구조-활성 관계 연구를 달성할 수 있습니다. 이 모델에 의해 생성된 거대한 합성 약물 유사 화학적 공간은 약물 용도 변경 또는 히트 분자 검색의 실제 양성률을 향상시킬 수 있습니다.

위 내용은 Peking University & Wangshi Intelligence는 화학 반응 사전 훈련과 조건부 분자 생성 간의 격차를 해소하는 새로운 모델을 제안합니다!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제