수백만 개의 결정 데이터로 훈련하여 결정학적 위상 문제를 해결하는 딥러닝 방법인 PhAI가 Science에 게재되었습니다.-일체 포함-php.cn

집

기술 주변기기

일체 포함

수백만 개의 결정 데이터로 훈련하여 결정학적 위상 문제를 해결하는 딥러닝 방법인 PhAI가 Science에 게재되었습니다.

王林

Aug 08, 2024 pm 09:22 PM

이론

수백만 개의 결정 데이터로 훈련하여 결정학적 위상 문제를 해결하는 딥러닝 방법인 PhAI가 Science에 게재되었습니다.

Editor | KX

오늘날까지 단순한 금속부터 큰 막 단백질까지 결정학에 의해 결정되는 구조적 세부 사항과 정밀도는 다른 어떤 방법과도 비교할 수 없습니다. 그러나 가장 큰 과제인 소위 위상 문제는 실험적으로 결정된 진폭에서 위상 정보를 검색하는 것입니다.

덴마크 코펜하겐 대학의 연구원들은 결정 위상 문제를 해결하기 위해 PhAI라는 딥 러닝 방법을 개발했습니다. 수백만 개의 인공 결정 구조와 그에 상응하는 합성 회절 데이터를 사용하여 훈련된 딥 러닝 신경망은 정확한 전자 밀도 지도를 생성할 수 있습니다.

연구에 따르면 이 딥 러닝 기반 ab initio 구조 솔루션 방법은 단 2옹스트롬의 분해능으로 위상 문제를 해결할 수 있는 것으로 나타났습니다. 이는 원자 분해능에서 사용 가능한 데이터의 10~20%에 해당하는 반면 기존 Ab initio는 방법은 일반적으로 원자 분해능이 필요합니다.

관련 연구는 "PhAI: A deep-learning Approach to 해결할 the crystallographic Phase 문제"라는 제목으로 "Science" 8월 1일자에 게재되었습니다.

수백만 개의 결정 데이터로 훈련하여 결정학적 위상 문제를 해결하는 딥러닝 방법인 PhAI가 Science에 게재되었습니다.

논문 링크: https://www.science.org/doi/10.1126/science.adn2777

결정학은 자연과학의 핵심 분석 기술 중 하나입니다. X선 결정학은 결정의 3차원 구조에 대한 독특한 시각을 제공합니다.

전자 밀도 맵을 재구성하려면 회절 반사의 복잡한 구조 인자 $F$를 충분히 알아야 합니다. 기존 실험에서는 진폭 $|F|$만 얻고 위상 $phi$는 손실됩니다. 이것은 결정학적 위상 문제입니다.

수백만 개의 결정 데이터로 훈련하여 결정학적 위상 문제를 해결하는 딥러닝 방법인 PhAI가 Science에 게재되었습니다.

그림: 표준 결정 구조 결정 흐름도. (출처: Paper)

1950년대와 1960년대에 Karle과 Hauptmann**이 위상 문제를 해결하기 위한 소위 직접적인 방법을 개발하면서 획기적인 발전이 이루어졌습니다. 그러나 직접 방법에는 원자 분해능 회절 데이터가 필요합니다. 그러나 원자 분해능의 요구 사항은 경험적 관찰입니다.

최근에는 전통적인 직접 방식이 이중 공간 방식으로 보완되었습니다. 현재 사용 가능한 ab initio 방법은 한계에 도달한 것 같습니다. 위상 문제에 대한 일반적인 해결책은 아직 알려지지 않았습니다.

수학적으로 말하면, 구조 인자 진폭과 위상의 모든 조합은 역푸리에 변환의 대상이 될 수 있습니다. 그러나 물리적, 화학적 요구 사항(예: 원자와 유사한 전자 밀도 분포)은 일련의 진폭과 일치하는 가능한 위상 조합에 규칙을 적용합니다. 딥 러닝의 발전으로 인해 현재의 ab initio 방법보다 더 깊이 있게 이러한 관계를 탐색할 수 있게 되었습니다.

여기서 코펜하겐 대학의 연구원들은 결정학의 위상 문제를 해결하는 것을 목표로 수백만 개의 인공 결정 구조와 해당 회절 데이터를 사용하는 데이터 기반 접근 방식을 취했습니다.

연구에 따르면 이 딥러닝 기반 ab initio 구조 해결 방법은 직접 방법에서 필요한 데이터만 사용하여 최소 격자 평면 거리(dmin) = 2.0Å의 분해능 10~20%에서 수행할 수 있는 것으로 나타났습니다. .

Neural Network Design and Training

구성된 인공 신경망은 PhAI라고 하며, 구조 인자 진폭 |F|을 받아 해당 위상 값 ф을 출력합니다. PhAI의 아키텍처는 아래 그림과 같습니다.

수백만 개의 결정 데이터로 훈련하여 결정학적 위상 문제를 해결하는 딥러닝 방법인 PhAI가 Science에 게재되었습니다.

그림: PhAI 신경망 방법은 위상 문제를 해결합니다. (출처: 논문) 결정 구조의 구조 인자 수는 단위 셀 크기에 따라 달라집니다. 컴퓨팅 리소스에 따라 입력 데이터의 크기에 제한이 있습니다. 입력 구조 인자 진폭은

수백만 개의 결정 데이터로 훈련하여 결정학적 위상 문제를 해결하는 딥러닝 방법인 PhAI가 Science에 게재되었습니다.

1을 준수하는 밀러 지수(h, k, l)를 기반으로 선택됩니다.
즉, 구조는 원자 분해능에서 약 10Å의 단위 셀 크기로 제한됩니다. 또한 가장 일반적인 중심대칭 공간 그룹 P21/c가 선택되었습니다. 중앙 대칭은 가능한 위상 값을 0 또는 π rad로 제한합니다.

研究使用主要包含有机分子的人工晶体结构训练神经网络。创建了大约 49,000,000 个结构，其中有机晶体结构占 94.29%，金属有机晶体结构占 5.66%，无机晶体结构占 0.05%。
神经网络的输入由振幅和相位组成，它们由卷积输入块处理，添加并输入到一系列卷积块（Conv3D）中，然后是一系列多层感知器（MLP）块。来自线性分类器（相位分类器）的预测相位通过网络循环 Nc 次。训练数据是通过将 GDB-13 数据库中的金属原子和有机分子插入到晶胞中生成的。生成的结构被组织成训练数据，从中可以计算出在采样温度因子、分辨率和完整性时的真实相位和结构因子振幅。
解决真实结构问题
经过训练的神经网络在标准计算机上运行，计算需求适中。它接受 hkl 索引列表和相应的结构因子振幅作为输入。不需要其他输入信息，甚至不需要结构的晶胞参数。这与所有其他现代从头算方法有着根本区别。网络可以即时预测并输出相位值。
研究人员使用计算得出的真实晶体结构的衍射数据测试了神经网络的性能。共获得 2387 个测试用例。对于所有收集的结构，考虑了多个数据分辨率值，范围从 1.0 到 2.0 Å。为了进行比较，还使用了电荷翻转方法来检索相位信息。
图示：相位和真实电子密度图之间的相关系数 r 的直方图。
（来源：论文）

经过训练的神经网络表现出色；如果相应的衍射数据分辨率良好，它可以解决所有测试结构（N = 2387），并且在从低分辨率数据中解决结构方面表现出色。尽管神经网络几乎没有针对无机结构进行训练，但它可以完美地解决此类结构。

电荷翻转法在处理高分辨率数据时表现优异，但随着数据分辨率的降低，其产生合理正确解的能力逐渐下降；然而，它仍然以 1.6Å 的分辨率解决了大约 32% 的结构。通过进一步试验和更改输入参数（例如翻转阈值），可以改善通过电荷翻转确定的结构数量。

在 PhAI 方法中，这种元优化是在训练期间执行的，不需要由用户执行。这些结果表明，在晶体学中必须有原子分辨率数据才能从头算相位的普遍观念可能被打破。PhAI 仅需要 10% 至 20% 的原子分辨率数据。

这一结果清楚地表明，原子分辨率对于从头算方法来说不是必需的，并为基于深度学习的结构测定开辟了新途径。

这种深度学习方法的挑战是扩展神经网络，也就是说，较大晶胞的衍射数据将需要大量的输入和输出数据以及训练期间的计算成本。未来，需要进一步研究，将该方法扩展到一般情况。

위 내용은 수백만 개의 결정 데이터로 훈련하여 결정학적 위상 문제를 해결하는 딥러닝 방법인 PhAI가 Science에 게재되었습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

외삽에 대한 포괄적 인 가이드Apr 15, 2025 am 11:38 AM

소개 매일 몇 주 만에 작물의 진행 상황을 관찰하는 농부가 있다고 가정합니다. 그는 성장률을보고 몇 주 안에 식물이 얼마나 키가 커질 수 있는지에 대해 숙고하기 시작합니다. Th

소프트 AI의 부상과 오늘날 비즈니스의 의미Apr 15, 2025 am 11:36 AM

Soft AI-대략적인 추론, 패턴 인식 및 유연한 의사 결정을 사용하여 구체적이고 좁은 작업을 수행하도록 설계된 AI 시스템으로 정의 된 것은 모호성을 수용하여 인간과 같은 사고를 모방하려고합니다. 그러나 이것이 바이러스의 의미는 무엇입니까?

AI 국경을위한 진화 보안 프레임 워크Apr 15, 2025 am 11:34 AM

클라우드 컴퓨팅이 클라우드 네이티브 보안 도구로의 전환이 필요했기 때문에 AI는 AI의 고유 한 요구를 위해 특별히 설계된 새로운 유형의 보안 솔루션을 요구합니다. 클라우드 컴퓨팅 및 보안 수업의 상승이 배웠습니다 th

3 가지 방법 생성 AI 기업가를 증폭시킵니다 : 평균을 조심하십시오!Apr 15, 2025 am 11:33 AM

기업가와 AI 및 생성 AI를 사용하여 비즈니스를 개선합니다. 동시에, 모든 기술과 마찬가지로 생성 AI를 기억하는 것이 중요합니다. 앰프는 앰프입니다. 엄격한 2024 연구 o

Andrew Ng의 모델 임베딩에 대한 새로운 단기 과정Apr 15, 2025 am 11:32 AM

임베딩 모델의 힘 잠금 해제 : Andrew Ng의 새로운 코스에 대한 깊은 다이빙 기계가 완벽한 정확도로 질문을 이해하고 응답하는 미래를 상상해보십시오. 이것은 공상 과학이 아닙니다. AI의 발전 덕분에 R이되었습니다

대형 언어 모델 (LLMS)에서 환각이 불가피합니까?Apr 15, 2025 am 11:31 AM

대형 언어 모델 (LLM) 및 환각의 피할 수없는 문제 Chatgpt, Claude 및 Gemini와 같은 AI 모델을 사용했을 것입니다. 이들은 대규모 텍스트 데이터 세트에 대해 교육을받은 강력한 AI 시스템의 대형 언어 모델 (LLM)의 예입니다.

60% 문제 - AI 검색이 트래픽을 배출하는 방법Apr 15, 2025 am 11:28 AM

최근의 연구에 따르면 AI 개요는 산업 및 검색 유형에 따라 유기 트래픽이 15-64% 감소 할 수 있습니다. 이러한 급격한 변화로 인해 마케팅 담당자는 디지털 가시성에 관한 전체 전략을 재고하게합니다. 새로운

AI R & D의 중심에 인간 번성을하는 MIT Media LabApr 15, 2025 am 11:26 AM

Elon University의 Digital Future Center를 상상 한 최근 보고서는 거의 300 명의 글로벌 기술 전문가를 조사했습니다. 결과적인 보고서 인‘2035 년에 인간이되는 것’은 대부분 AI 시스템의 심화가 T에 대한 우려가 있다고 결론지었습니다.

See all articles

핫 AI 도구

뜨거운 도구

DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

맨티스BT

Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.

SublimeText3 영어 버전

권장 사항: Win 버전, 코드 프롬프트 지원!

mPDF

mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.