搜索
首页科技周边人工智能北大&望石智慧提出全新模型:弥合化学反应预训练与条件分子生成之间的鸿沟!

化学反应是药物设计和有机化学研究的基础。研究界越来越需要一种能够有效捕获化学反应基本规则的大规模深度学习框架。

近日,来自北京大学和望石智慧的研究团队提出了一种新方法来弥合基于反应的分子预训练和生成任务之间的差距。

受到有机化学机制的启发,研究人员开发了一种新的预训练框架,使其能够将归纳偏差纳入模型中。这个提出的框架在执行具有挑战性的下游任务时取得了最先进的结果。通过掌握化学知识,该框架克服了目前依赖少量反应模板的分子生成模型的局限性。在大量的实验中,该模型生成了高质量的可合成药物样结构

总的来说,该研究向各种基于反应的应用程序的大规模深度学习框架迈出了重要一步。

该研究以《Bridging the gap between chemical reaction pretraining and conditional molecule generation with a unified model》为题,于 2023 年 12 月 5 日发布在《Nature Machine Intelligence》上。

北大&望石智慧提出全新模型:弥合化学反应预训练与条件分子生成之间的鸿沟!

论文链接:https://www.nature.com/articles/s42256-023-00764-9

深度学习模型已经在许多科学研究领域得到广泛应用。预训练框架对于新任务的无缝集成起到了积极作用,可以加快建模过程,特别是在标记数据有限的情况下

药物设计和有机化学研究的基础是化学反应。目前,数据挖掘的研究和应用已经使得深度学习模型可以用于化学反应。基于这些数据,已经有许多数据驱动的研究深入研究化学反应的表征学习

表征学习是指从数据中自动学习有用的特征,然后将其用于各种下游任务。现有方法忽略了有机化学的基本理论,限制了其性能。

基于化学反应的分子生成

除了反应分类任务外,基于化学反应的分子生成也是一个重要的应用。在早期的研究中,通常采用基于模板的逐步分子生成策略

这些基于模板的方法在很大程度上依赖于预定义的构建模块和反应,这缩小了可访问的化学空间。在反应产物预测领域也发现了类似的趋势,其中基于模板的方法不能外推到复杂的反应;这个问题可以通过使用无模板方法来解决。

在基于反应的分子生成任务中,无模板方法也表现出了优于基于模板方法的泛化优势。然而,现有的无模板分子生成方法只能基于预定义的反应物库生成分子。除此之外,对于药物设计中的先导化合物或先导化合物优化阶段,利用化学反应作为编辑工具来修改给定的结构是更有利的。生成的化学库将重点关注可以用更少的反应步骤合成的化学空间的子集。

一个新、全面的化学反应深度学习框架

在此,研究人员提出了一个新的、全面的化学反应深度学习框架,称为 Uni-RXN。旨在解决两个基本任务:自监督表征学习和条件生成建模。

北大&望石智慧提出全新模型:弥合化学反应预训练与条件分子生成之间的鸿沟!

展示:Uni-RXN的组成和方法。(引自:论文)

与现有方法不同,研究人员提出了一套专门针对化学反应精心设计的自监督任务。这些任务包括反应中心预测、主反应物与子反应物配对以及反应物-产物配对。在对具有挑战性的反应任务的广泛评估中,Uni-RXN 方法超越了最先进的水平,证明了其有效捕获化学反应领域知识的能力。所获得的有希望的结果为广泛的下游应用铺平了道路

通过有效捕获化学规则,Uni-RXN 非常适合生成任务。与依赖于从预定义反应物库中选择片段的传统方法不同,Uni-RXN 将分子结构作为输入条件并生成相应反应物的表示,同时保持反应内的排列不变性。利用密集向量相似性搜索包的强大功能,Uni-RXN 能够从大型反应物和试剂库中高效检索反应物。随后,采用反应预测模型来生成产物输出。

与仅探索化学空间的有限子集的基于模板的方法相比,Uni-RXN 在生成更广泛的可合成药物样结构方面表现出卓越的性能。这一特点使其特别适合虚拟 library 枚举,并得到全面统计分析和案例研究的支持。

Uni-RXN 方法有许多优势,可以为具有挑战性的化学反应分类任务生成丰富的表达。相对于其他基线模型,Uni-RXN 在每类仅提供 4 个数据点的情况下,准确率达到了 58.7%

重写后的内容:化学反应分类的准确度见表1。(来源:论文)

北大&望石智慧提出全新模型:弥合化学反应预训练与条件分子生成之间的鸿沟!

Transformer 模型可以被用来区分优化和未优化的化学反应数据。此外,编码器也可以轻松应用于结构条件的生成

北大&望石智慧提出全新模型:弥合化学反应预训练与条件分子生成之间的鸿沟!

需要重新改写的内容是:图表展示了Uni-RXN的检索性能和注意力权重。(来源:论文)

研究结果强调了所提出的模型所生成的分子具有有利的特性,这使得它们非常适合于药物发现任务。该模型可以生成更多具有类似药物特性和可合成性的分子

北大&望石智慧提出全新模型:弥合化学反应预训练与条件分子生成之间的鸿沟!

图示:Uni-RXNGen 流程与性能。(来源:论文)

与分子对接等虚拟筛选方法相结合,该生成模型可以实现高效的构效关系研究。该模型生成的巨大的可合成类药物化学空间可以提高药物再利用或命中分子搜索的真阳性率。

以上是北大&望石智慧提出全新模型:弥合化学反应预训练与条件分子生成之间的鸿沟!的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:51CTO.COM。如有侵权,请联系admin@php.cn删除
外推指南外推指南Apr 15, 2025 am 11:38 AM

介绍 假设有一个农民每天在几周内观察农作物的进展。他研究了增长率,并开始思考他的植物在几周内可以生长的高度。从Th

软AI的兴起及其对当今企业的意义软AI的兴起及其对当今企业的意义Apr 15, 2025 am 11:36 AM

软AI(被定义为AI系统,旨在使用近似推理,模式识别和灵活的决策执行特定的狭窄任务 - 试图通过拥抱歧义来模仿类似人类的思维。 但是这对业务意味着什么

为AI前沿的不断发展的安全框架为AI前沿的不断发展的安全框架Apr 15, 2025 am 11:34 AM

答案很明确 - 只是云计算需要向云本地安全工具转变,AI需要专门为AI独特需求而设计的新型安全解决方案。 云计算和安全课程的兴起 在

生成AI的3种方法放大了企业家:当心平均值!生成AI的3种方法放大了企业家:当心平均值!Apr 15, 2025 am 11:33 AM

企业家,并使用AI和Generative AI来改善其业务。同时,重要的是要记住生成的AI,就像所有技术一样,都是一个放大器 - 使得伟大和平庸,更糟。严格的2024研究O

Andrew Ng的新简短课程Andrew Ng的新简短课程Apr 15, 2025 am 11:32 AM

解锁嵌入模型的力量:深入研究安德鲁·NG的新课程 想象一个未来,机器可以完全准确地理解和回答您的问题。 这不是科幻小说;多亏了AI的进步,它已成为R

大语言模型(LLM)中的幻觉是不可避免的吗?大语言模型(LLM)中的幻觉是不可避免的吗?Apr 15, 2025 am 11:31 AM

大型语言模型(LLM)和不可避免的幻觉问题 您可能使用了诸如Chatgpt,Claude和Gemini之类的AI模型。 这些都是大型语言模型(LLM)的示例,在大规模文本数据集上训练的功能强大的AI系统

60%的问题 -  AI搜索如何消耗您的流量60%的问题 - AI搜索如何消耗您的流量Apr 15, 2025 am 11:28 AM

最近的研究表明,根据行业和搜索类型,AI概述可能导致有机交通下降15-64%。这种根本性的变化导致营销人员重新考虑其在数字可见性方面的整个策略。 新的

麻省理工学院媒体实验室将人类蓬勃发展成为AI R&D的核心麻省理工学院媒体实验室将人类蓬勃发展成为AI R&D的核心Apr 15, 2025 am 11:26 AM

埃隆大学(Elon University)想象的数字未来中心的最新报告对近300名全球技术专家进行了调查。由此产生的报告“ 2035年成为人类”,得出的结论是,大多数人担心AI系统加深的采用

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
4 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
4 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
4 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.聊天命令以及如何使用它们
4 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

螳螂BT

螳螂BT

Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

SublimeText3 英文版

SublimeText3 英文版

推荐:为Win版本,支持代码提示!

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),