Tsinghua 팀은 지식 기반 그래프를 제안합니다. Transformer 사전 훈련 프레임워크: 분자 표현 학습을 개선하는 방법-일체 포함-php.cn

집

기술 주변기기

일체 포함

Tsinghua 팀은 지식 기반 그래프를 제안합니다. Transformer 사전 훈련 프레임워크: 분자 표현 학습을 개선하는 방법

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Nov 23, 2023 pm 06:17 PM

시작하기

清华团队提出知识引导的图 Transformer 预训练框架：提高分子表征学习的方法

Editor | Ziluo

분자 특성 예측을 용이하게 하려면 신약 개발 분야에서 효과적인 분자 특징 표현을 배우는 것이 매우 중요합니다. 최근 사람들은 자기 지도 학습 기술을 사용하여 그래프 신경망(GNN)을 사전 훈련함으로써 데이터 부족 문제를 극복했습니다. 그러나 자기 지도 학습을 기반으로 하는 현재 방법에는 두 가지 주요 문제가 있습니다. 명확한 자기 지도 학습 전략이 부족하고 GNN의 제한된 기능입니다.

최근 Tsinghua University, West Lake University 및 Zhijiang Laboratory의 연구팀이 지식을 제안했습니다. 지침 KPGT(Knowledge-guided Pre-training of Graph Transformer)는 크게 향상된 분자 표현 학습을 통해 분자 특성에 대한 개선되고 일반화 가능하며 강력한 예측을 제공하는 자기 지도 학습 프레임워크입니다. KPGT 프레임워크는 분자 그래프용으로 특별히 설계된 그래프 변환기와 지식 기반 사전 학습 전략을 통합하여 분자의 구조적, 의미적 지식을 완벽하게 포착합니다.

KPGT는 63개 데이터 세트에 대한 광범위한 컴퓨터 테스트를 통해 다양한 분야에서 분자 특성 예측에 탁월한 성능을 입증했습니다. 또한, 두 가지 항종양 표적에 대한 잠재적인 억제제를 식별함으로써 신약 발굴에서 KPGT의 실제 적용 가능성을 검증했습니다. 전반적으로 KPGT는 AI 지원 약물 발견 프로세스를 발전시키기 위한 강력하고 유용한 도구를 제공할 수 있습니다.

이 연구의 제목은 "분자 표현 학습 개선을 위한 지식 기반 사전 훈련 프레임워크"이며 2023년 11월 21일 "Nature Communications"에 게재되었습니다.

清华团队提出知识引导的图 Transformer 预训练框架：提高分子表征学习的方法

분자 특성을 실험적으로 결정하려면 상당한 시간과 자원이 필요하며, 원하는 특성을 가진 분자를 식별하는 것은 약물 발견에서 가장 중요한 과제 중 하나입니다. 최근 몇 년 동안 인공지능 기반 방법은 분자 특성을 예측하는 데 점점 더 중요한 역할을 하고 있습니다. 분자 특성을 예측하기 위한 AI 기반 방법의 주요 과제 중 하나는 분자의 특성화입니다

최근 몇 년 동안 딥 러닝 기반 방법은 분자 특성을 예측하는 데 잠재적으로 유용한 도구로 부상했습니다. 간단한 입력 데이터를 효과적으로 특성화하는 탁월한 능력. 특히 RNN(Recurrent Neural Network), CNN(Convolutional Neural Network), GNN(Graph Neural Network)을 포함한 다양한 신경망 아키텍처는 단순화된 분자 입력부터 라인 입력 시스템에 이르기까지 다양한 형식의 분자 데이터를 모델링하는 데 능숙합니다. SMILES)을 분자 이미지와 분자 다이어그램으로 변환합니다. 그러나 마커 분자의 제한된 가용성과 화학적 공간의 광대함은 특히 배포되지 않은 데이터 샘플을 처리할 때 예측 성능을 제한합니다.

자연어 처리 및 컴퓨터 비전 분야에서 자기 지도 학습 방법의 놀라운 성과를 통해 이러한 기술은 GNN을 사전 훈련하고 분자의 표현 학습을 개선하는 데 적용되어 다운스트림 분자 특성 예측 작업에서 상당한 결과를 얻었습니다. . Progress

연구원들은 분자 특성을 정량적으로 설명하는 추가 지식을 자기 지도 학습 프레임워크에 도입하면 이러한 문제를 효과적으로 해결할 수 있다고 가정합니다. 분자는 현재 확립된 계산 도구를 사용하여 쉽게 얻을 수 있는 분자 설명자 및 지문과 같은 많은 정량적 특성을 가지고 있습니다. 이러한 추가 지식을 통합하면 풍부한 분자 의미론적 정보를 자기 지도 학습에 도입할 수 있으므로 의미론적으로 풍부한 분자 표현의 획득이 크게 향상됩니다.

일반적으로 기존의 자기 지도 학습 방법은 GNN을 핵심 모델로 사용합니다. 그러나 GNN은 모델 용량이 제한되어 있습니다. 또한 GNN은 원자 간의 장거리 상호 작용을 포착하는 데 어려움을 겪을 수 있습니다. 그리고 Transformer 기반 모델은 판도를 바꾸는 모델이 되었습니다. 이는 매개변수 수가 증가하고 장거리 상호 작용을 포착하는 능력이 특징이며, 분자의 구조적 특징을 종합적으로 모델링하는 유망한 접근 방식을 제공합니다

자기 지도 학습 프레임워크 KPGT

이 연구에서 연구원들은 KPGT라는 자기 지도 학습 프레임워크는 분자 표현 학습을 향상시켜 다운스트림 분자 특성 예측 작업을 촉진하기 위해 개발되었습니다. KPGT 프레임워크는 LiGhT(Line Graph Transformer)라는 백본 모델과 지식 기반 사전 학습 정책이라는 두 가지 주요 구성 요소로 구성됩니다. KPGT 프레임워크는 분자 그래프 구조를 정확하게 모델링하도록 특별히 설계된 고용량 LiGhT 모델을 결합하고 지식 기반 사전 학습 전략을 활용하여 분자 구조와 의미 지식을 포착합니다.

연구팀은 ChEMBL29 데이터 세트 Molecule, LiGhT는 지식 기반 사전 학습 전략

清华团队提出知识引导的图 Transformer 预训练框架：提高分子表征学习的方法

재작성된 콘텐츠: 다이어그램: KPGT 개요를 통해 사전 학습되었습니다. (출처: 논문)

KPGT는 분자 특성 예측에서 기본 방법보다 성능이 뛰어납니다. 여러 기본 방법과 비교하여 KPGT는 63개 데이터 세트에서 상당한 개선을 달성했습니다.

清华团队提出知识引导的图 Transformer 预训练框架：提高分子表征学习的方法

그림: 분자 특성 예측에 있어서 KPGT와 기본 방법의 비교 평가. (출처: 논문)

또한 KPGT를 사용하여 두 가지 항종양 표적인 조혈 전구 키나제 1(HPK1)과 섬유아세포 성장 인자 수용체(FGFR1)의 잠재적 억제제를 식별하는 데 성공함으로써 KPGT의 실제 적용이 입증되었습니다.

清华团队提出知识引导的图 Transformer 预训练框架：提高分子表征学习的方法

그림: KPGT를 사용한 HPK1 억제제 식별. (출처: 논문)

清华团队提出知识引导的图 Transformer 预训练框架：提高分子表征学习的方法

그림: KPGT를 사용한 FGFR1 억제제 식별. (출처: 논문)

연구 한계

효과적인 분자 특성 예측에 있어서 KPGT의 장점에도 불구하고 여전히 몇 가지 한계가 있습니다.

우선, 추가 지식의 통합이 제안된 방법의 가장 중요한 특징입니다. KPGT에서 사용되는 200개의 분자 설명자와 512개의 RDKFP 외에도 다양한 유형의 추가 정보 지식을 통합할 수 있는 잠재력이 있습니다.
또한 추가 연구를 통해 3차원(3D) 분자 형태를 사전 학습 프로세스에 통합하여 모델이 분자에 대한 중요한 3D 정보를 캡처하고 잠재적으로 표현 학습 기능을 향상시킬 수 있습니다.
KPGT는 현재 약 1억 개의 매개변수와 200만 개의 분자에 대한 사전 훈련을 갖춘 백본 모델을 사용하고 있지만 대규모 사전 훈련을 탐색하면 분자 표현 학습에 더 실질적인 이점을 제공할 수 있습니다.

전반적으로 KPGT는 효과적인 분자 표현 학습을 위한 강력한 자기 지도 학습 프레임워크를 제공하여 인공 지능 지원 약물 발견 분야를 발전시킵니다.

논문 링크: https://www.nature.com/articles/s41467-023-43214-1

위 내용은 Tsinghua 팀은 지식 기반 그래프를 제안합니다. Transformer 사전 훈련 프레임워크: 분자 표현 학습을 개선하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 机器之心에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

최고의 프롬프트 엔지니어링 기술의 최신 연간 편집Apr 10, 2025 am 11:22 AM

내 칼럼을 처음 접할 수있는 분들을 위해, 나는 구체화 된 AI, AI 추론, AI의 첨단 획기적인 혁신, AI 교육, AI의 수비, ai re

유럽의 AI 대륙 행동 계획 : 기가 팩토리, 데이터 실험실 및 녹색 AIApr 10, 2025 am 11:21 AM

유럽의 야심 찬 AI 대륙 행동 계획은 EU를 인공 지능의 글로벌 리더로 설립하는 것을 목표로합니다. 핵심 요소는 AI Gigafactories 네트워크를 만드는 것입니다. 각각 약 100,000 개의 고급 AI 칩을 보유하고 있습니다 - Capaci의 4 배

Microsoft의 간단한 에이전트 스토리가 더 많은 팬을 만들기에 충분합니까?Apr 10, 2025 am 11:20 AM

AI 에이전트 애플리케이션에 대한 Microsoft의 통합 접근 방식 : 비즈니스를위한 명확한 승리 새로운 AI 에이전트 기능에 관한 Microsoft의 최근 발표는 명확하고 통합 된 프레젠테이션에 깊은 인상을 받았습니다. 많은 기술 발표와는 달리 TE에서 멍청한 것입니다

직원에게 AI 전략 판매 : Shopify CEO의 선언문Apr 10, 2025 am 11:19 AM

Shopify CEO Tobi Lütke의 최근 메모는 AI 숙련도가 모든 직원에 대한 근본적인 기대를 대담하게 선언하여 회사 내에서 중요한 문화적 변화를 표시합니다. 이것은 도망가는 트렌드가 아닙니다. 그것은 p에 통합 된 새로운 운영 패러다임입니다

IBM은 전체 AI 통합으로 Z17 메인 프레임을 출시합니다Apr 10, 2025 am 11:18 AM

IBM의 Z17 메인 프레임 : 향상된 비즈니스 운영을 위해 AI를 통합합니다 지난 달, IBM의 뉴욕 본사에서 Z17의 기능을 미리 보았습니다. Z16의 성공을 기반으로 (2022 년에 시작되어 지속적인 수익을 보여주는 시연

5 Chatgpt가 다른 사람에 따라 멈추고 자신을 완전히 믿으라고 프롬프트Apr 10, 2025 am 11:17 AM

흔들리지 않는 자신감을 해제하고 외부 검증의 필요성을 제거하십시오! 이 다섯 개의 chatgpt 프롬프트는 완전한 자립과 자기 인식의 변형적인 변화로 당신을 안내 할 것입니다. 간단히 괄호를 복사, 붙여 넣기 및 사용자 정의하십시오

AI는 당신의 마음과 위험합니다Apr 10, 2025 am 11:16 AM

인공 지능 보안 및 연구 회사 인 Anthropic의 최근 [연구]는 이러한 복잡한 과정에 대한 진실을 밝히기 시작하여 우리 자신의인지 영역과 방해가되는 복잡성을 보여줍니다. 자연 지능과 인공 지능은 우리가 생각하는 것보다 더 유사 할 수 있습니다. 내부 스누핑 : 의인성 해석 가능성 연구 Anthropic이 수행 한 연구에서 얻은 새로운 연구 결과는 AI의 내부 컴퓨팅을 역 엔지니어링하는 것을 목표로하는 기계적 해석 성 분야에서 상당한 발전을 나타냅니다. AI가하는 일을 관찰 할뿐만 아니라 인공 뉴런 수준에서 어떻게 수행하는지 이해합니다. 누군가가 특정한 대상을 보거나 특정한 아이디어에 대해 생각할 때 어떤 뉴런이 발사하는지 그림으로 뇌를 이해하려고한다고 상상해보십시오. 에이

Dragonwing은 Qualcomm의 가장자리 모멘텀을 보여줍니다Apr 10, 2025 am 11:14 AM

Qualcomm 's Dragonwing : 기업 및 인프라로의 전략적 도약 Qualcomm은 새로운 Dragonwing 브랜드를 통해 전 세계적으로 엔터프라이즈 및 인프라 시장을 대상으로 모바일을 넘어 범위를 적극적으로 확장하고 있습니다. 이것은 단지 Rebran이 아닙니다

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

mPDF

mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.