首页 >科技周边 >人工智能 >使用几何深度学习方法预测合成药物分子的最佳方案,为新药发现铺平道路

使用几何深度学习方法预测合成药物分子的最佳方案,为新药发现铺平道路

WBOY
WBOY转载
2024-01-13 22:36:07982浏览

使用几何深度学习方法预测合成药物分子的最佳方案,为新药发现铺平道路

后期功能化是一种经济的方法,用于优化候选药物的特性。然而,药物分子的化学复杂性经常使得后期功能化变得具有挑战性

为了解决这个问题,德国慕尼黑大学、苏黎世联邦理工学院和巴塞尔罗氏制药的研究人员合作开发了一个后期功能化平台,该平台基于几何深度学习和高通量反应筛选技术

鉴于硼基化是功能化的关键步骤之一,我们使用计算模型预测了不同反应条件下的产率,平均绝对误差范围为4-5%。该模型能够对已知和未知底物进行新反应的分类,分类的准确度分别为92%和67%。我们能够准确捕获主要产物的区域选择性,分类器的F分数为67%。我们在应用于23种不同的商业药物分子时,成功发现了许多结构多样化的机会

该研究题为「利用几何深度学习实现高通量实验来促进后期药物多样化」,于2023年11月23日在《自然化学》杂志上发表

使用几何深度学习方法预测合成药物分子的最佳方案,为新药发现铺平道路

LSF项目在药物化学研究中起着重要的作用

在旨在建立药物化学中的结构-活性关系时,结构的新颖性和复杂性使得合成化学目标结构具有挑战性。构效关系模型可指导先导化合物和先导化合物优化方案,以提高候选药物的药理活性和理化性质。对于结构-活性关系的探索,高效整合至关重要,这是设计-制造-测试-分析周期的瓶颈

有许多可选择的方法可以激活和修饰C-H键,以实现有机支架的后期功能化(LSF),范围从分子构件到高级药物分子。许多催化系统提供了定向和非定向的方法,以及对修饰类似物的化学和位点选择性访问

在众多的LSF方法中,C-H硼化方法被认为是最常用的快速化合物多样化方法。有机硼化合物可以转化为多种官能团,作为后续的C-C键偶联反应的可靠手段,从而实现广泛的结构-活性关系研究

然而,目前来看,在药物发现中,LSF的应用仅有一些报道。这些报道中大多数都集中在单一的LSF反应类型上。对于具有不同键强度、电子特性以及空间和官能团环境的多种类型的C-H键直接进行LSF提出了挑战。此外,开展LSF项目通常需要耗费大量的时间和资源,这与许多药物化学项目的紧迫时间表和有限资产并不相符

使用几何深度学习方法预测合成药物分子的最佳方案,为新药发现铺平道路

图表展示了硼化多样化研究的概述。(数据来源:论文)

人工智能支持的 LSF(Language Support Feature)

高通量实验 (HTE) 是一种既定的反应优化方法,可实现半自动小型化小批量筛选,从而快速、可重复地使用少量珍贵的构建模块和耗材并行执行多个转化。结合可生成有关成功和失败反应的高质量数据集的 FAIR(可查找性、可访问性、互操作性、可重用性)文档,HTE 通过实现高级数据分析和机器学习,为解锁 LSF 进行药物发现奠定了基础。

图神经网络(GNN)在分子特征提取和属性预测方面有着广泛的应用。在为化学反应规划开发的各种机器学习方法中,GNN 已成功应用于逆合成规划、区域选择性预测和反应产物预测。此外,还开发了 transformer 和基于指纹的方法来解决类似的问题

有研究显示,通过学习过渡态的几何结构,可以准确地预测竞争反应的结果。利用密度泛函理论(DFT)和原子部分电荷的图形特征化,可以改进对电子效应驱动的反应的区域选择性的预测。结合图机器学习和高通量实验(HTE),可以优化有机底物 C-H 活化反应的条件。一些研究着重于使用过渡态的深度学习模型,这些模型具有预测反应结果的能力,包括在某些情况下的对映选择性

然而,这些方法仅限于小分子结构和相对较小的数据集,使得将此类模型应用于结构更复杂的药物样分子具有挑战性。根据文献研究,通过过渡态的量子化学信息增强的混合机器学习模型,可以预测铱催化的硼化反应的区域选择性。然而,对于C-H活化反应模型的性能,以及在具有多个芳环系统的分子中的区域选择性应用,空间效应和电子效应的影响尚未被探索

几何深度学习的自动LSF硼化筛选

慕尼黑大学、苏黎世联邦理工学院和巴塞尔罗氏制药的研究人员介绍了一种应用于几何深度学习的自动LSF硼化筛选方法,用于识别后期命中和先导多样化机会。采用计算深度学习来预测复杂药物分子 LSF 的反应结果、产量和区域选择性。

使用几何深度学习方法预测合成药物分子的最佳方案,为新药发现铺平道路

图示:方法概述。 (来源:论文)

慕尼黑大学化学与药学学院和罗氏公司的研究小组主要作者、博士生David Nippa表示,通过这种方法,实验室实验的数量可能会显着减少,从而提高化学合成的效率和可持续性

对于该研究的首要步骤,我们对已经发表的文献进行了彻底的分析,以便选择适当的高通量筛选反应条件和与药物发现后期先导化合物性质相关的底物。我们根据手动整理的38篇文献数据集来确定反应条件

LSF底物的选择是基于对1,174种已批准药物的聚类分析结果,得出了23种结构不同的药物分子。这种方法使得研究人员能够在“信息库”方法中使用反应条件和底物的相关示例,而不是仅仅依赖于适用性有限的理想底物和片段来优化先导化合物的合成方法

在第二步中,研究人员使用半自动化高通量实验(HTE)生成数据(实验数据集)。所选药物分子和反应条件的反应数据为后续反应结果的机器学习提供了高质量的数据

最后,我们训练了不同的图神经网络(GNN)模型,使用二维、三维以及原子部分电荷加强的分子图来预测二元反应结果、反应产率以及区域选择性。苏黎世联邦理工学院的博士生Kenneth Atz 表示:“有趣的是,当我们考虑起始材料的三维信息而不仅仅是其二维化学式时,预测结果得到了改善。”

这种方法已经成功地用于确定现有活性成分中可以引入额外活性基团的位置。这对于研究人员更快地开发已知药物活性成分的新的、更有效的变体具有帮助

请点击以下链接查看论文内容:https://www.nature.com/articles/s41557-023- 01360-5

相关报道:https://techxplore.com/news/2023-11-人工智能为药物铺平道路.html

以上是使用几何深度学习方法预测合成药物分子的最佳方案,为新药发现铺平道路的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文转载于:jiqizhixin.com。如有侵权,请联系admin@php.cn删除