编辑 | 萝卜皮
蛋白质复合物结构预测在药物研发、抗体设计等应用中发挥着重要作用,然而由于预测精度有限,预测结果与实验结果经常出现不一致。
北京大学、昌平实验室以及哈佛大学的研究团队提出了 ColabDock,这是一个通用框架,它采用深度学习结构预测模型来整合不同形式和来源的实验约束,而无需进一步进行大规模的再训练或微调。
ColabDock 的表现优于使用 AlphaFold2 作为结构预测模型的 HADDOCK 和 ClusPro,不止在具有模拟残基和表面限制的复杂结构预测中,在借助核磁共振化学位移扰动以及共价标记进行的结构预测中也是如此。
另外,它还可以通过模拟界面扫描限制来帮助抗体-抗原界面预测。
该研究以「Integrated structure prediction of protein–protein docking with experimental restraints using ColabDock」为题,于 2024 年 8 月 5 日发布在《Nature Machine Intelligence》。
蛋白质对接为理解生物机制提供了重要的结构信息。尽管深度模型在蛋白质结构预测方面发展迅速,但大多数模型都是以自由对接的方式进行预测,这可能会导致实验约束与预测结构不一致。
为了解决这个问题,北京大学、昌平实验室等机构的研究团队提出了用于受限复合物构象预测的通用框架——ColabDock,它是一个由稀疏实验约束引导的蛋白质-蛋白质对接的通用框架。
通过梯度反向传播,该方法有效地整合了实验约束的先验和数据驱动的蛋白质结构预测模型的能量景观,自动搜索满足两者的构象,同时容忍约束中的冲突或模糊性。
ColabDock 可以利用不同形式和来源的实验约束,而无需进一步进行大规模重新训练或微调。
该框架包含两个阶段:生成阶段和预测阶段。
在生成阶段,ColabDock 采用了基于 AlphaFold2 开发的蛋白质设计框架 ColabDesign。在 logit 空间中优化输入序列配置文件,以指导结构预测模型根据给定的实验约束和模板生成复杂结构,同时最大化 pLDDT 和 pAE 测量。
在预测阶段,根据生成的复合物结构和给定的模板预测结构。对于每个目标,ColabDock 会执行多次运行并生成不同的构象。最终构象由排序支持向量机 (SVM) 算法选择。
性能稳健
作为概念验证,研究人员采用 AlphaFold2 作为 ColabDock 中的结构预测模型。当然,这里也可以使用其他数据驱动的深度学习模型,例如 RoseTTAFold2 和 AF-Multimer。
研究人员用合成数据集和几种类型的实验约束上测试 ColabDock,包括 NMR 化学位移扰动 (CSP)、共价标记 (CL) 和模拟深度突变扫描 (DMS)。
图示:ColabDock 在验证集上的表现。(来源:论文)
ColabDock 评估了两种类型的约束,即 1v1 和 MvN 约束。前者是残基-残基级别的,实例包括来自 XL-MS 的约束。后者是界面级别的,与 NMR 和 CL 实验有关。
在合成数据集上的测试结果表明 ColabDock 取得了令人满意的性能。此外,正如预期的那样,随着约束数量的增加,ColabDock 的性能也得到了提高。
即使只有很少的限制,ColabDock 在基准数据集和相同的框架设置上的表现也优于 AF-Multimer,并且在提供更多限制的情况下收敛到更少的构象,表明有效应用了附加信息。
图示:在基准测试集上对 ColabDock、HADDOCK 和 ClusPro 进行比较。(来源:论文)
Compared with HADDOCK and ClusPro, ColabDock performs better when the constraint quality is higher. On both experimental datasets, ColabDock still outperforms HADDOCK and ClusPro regardless of the number and quality of constraints provided.
Illustration: Performance and constraint analysis of ColabDock on CSP set. (Source: paper)
Finally, the researchers evaluated the performance of different docking methods on the antibody-antigen data set. ColabDock predicted a much higher proportion of medium or higher quality structures than HADDOCK and ClusPro.
Illustration: Comparison of ColabDock, HADDOCK and ClusPro on the antibody-antigen benchmark set. (Source: paper)
This shows that ColabDock has potential application value in antibody design. Moreover, ColabDock still shows comparable or even better performance than AF-Multimer on the newly released unbiased dataset.
Limitations and Conclusion
ColabDock also has some limitations. Currently, ColabDock can only accept distances smaller than 22 Å, which is determined by the upper limit of the distance map in AlphaFold2. This limitation renders the model applicable to only a small subset of XL-MS reagents.
Without fragment-based optimization, ColabDock can only process complexes of less than 1,200 residues on an NVIDIA A100 graphics processing unit (GPU) due to limited memory.
In addition, this method can be very time-consuming, especially for large protein complexes. Using the bfloat16 floating point format version of AlphaFold2 is expected to help save memory and speed up calculations.
I believe that in the future, after researchers iteratively optimize it, as a unified framework, ColabDock will be able to help bridge the gap between experimental and computational protein science.
Paper link:https://www.nature.com/articles/s42256-024-00873-z
以上是Nature子刊,北大团队通用AI框架对蛋白-蛋白对接进行综合结构预测,弥合实验与计算的差距的详细内容。更多信息请关注PHP中文网其他相关文章!

你可能听过以下犀利的观点:1.跟着NVIDIA的技术路线,可能永远也追不上NVIDIA的脚步。2.DSA或许有机会追赶上NVIDIA,但目前的状况是DSA濒临消亡,看不到任何希望另一方面,我们都知道现在大模型正处于风口位置,业界很多人想做大模型芯片,也有很多人想投大模型芯片。但是,大模型芯片的设计关键在哪,大带宽大内存的重要性好像大家都知道,但做出来的芯片跟NVIDIA相比,又有何不同?带着问题,本文尝试给大家一点启发。纯粹以观点为主的文章往往显得形式主义,我们可以通过一个架构的例子来说明Sam

2021年9月25日,阿里云发布了开源项目通义千问140亿参数模型Qwen-14B以及其对话模型Qwen-14B-Chat,并且可以免费商用。Qwen-14B在多个权威评测中表现出色,超过了同等规模的模型,甚至有些指标接近Llama2-70B。此前,阿里云还开源了70亿参数模型Qwen-7B,仅一个多月的时间下载量就突破了100万,成为开源社区的热门项目Qwen-14B是一款支持多种语言的高性能开源模型,相比同类模型使用了更多的高质量数据,整体训练数据超过3万亿Token,使得模型具备更强大的推

在法国巴黎举行了国际计算机视觉大会ICCV(InternationalConferenceonComputerVision)本周开幕作为全球计算机视觉领域顶级的学术会议,ICCV每两年召开一次。ICCV的热度一直以来都与CVPR不相上下,屡创新高在今天的开幕式上,ICCV官方公布了今年的论文数据:本届ICCV共有8068篇投稿,其中有2160篇被接收,录用率为26.8%,略高于上一届ICCV2021的录用率25.9%在论文主题方面,官方也公布了相关数据:多视角和传感器的3D技术热度最高在今天的开

8月31日,文心一言首次向全社会全面开放。用户可以在应用商店下载“文心一言APP”或登录“文心一言官网”(https://yiyan.baidu.com)进行体验据报道,百度计划推出一系列经过全新重构的AI原生应用,以便让用户充分体验生成式AI的理解、生成、逻辑和记忆等四大核心能力今年3月16日,文心一言开启邀测。作为全球大厂中首个发布的生成式AI产品,文心一言的基础模型文心大模型早在2019年就在国内率先发布,近期升级的文心大模型3.5也持续在十余个国内外权威测评中位居第一。李彦宏表示,当文心

保险行业对于社会民生和国民经济的重要性不言而喻。作为风险管理工具,保险为人民群众提供保障和福利,推动经济的稳定和可持续发展。在新的时代背景下,保险行业面临着新的机遇和挑战,需要不断创新和转型,以适应社会需求的变化和经济结构的调整近年来,中国的保险科技蓬勃发展。通过创新的商业模式和先进的技术手段,积极推动保险行业实现数字化和智能化转型。保险科技的目标是提升保险服务的便利性、个性化和智能化水平,以前所未有的速度改变传统保险业的面貌。这一发展趋势为保险行业注入了新的活力,使保险产品更贴近人民群众的实际

随着智慧司法的兴起,智能化方法驱动的智能法律系统有望惠及不同群体。例如,为法律专业人员减轻文书工作,为普通民众提供法律咨询服务,为法学学生提供学习和考试辅导。由于法律知识的独特性和司法任务的多样性,此前的智慧司法研究方面主要着眼于为特定任务设计自动化算法,难以满足对司法领域提供支撑性服务的需求,离应用落地有不小的距离。而大型语言模型(LLMs)在不同的传统任务上展示出强大的能力,为智能法律系统的进一步发展带来希望。近日,复旦大学数据智能与社会计算实验室(FudanDISC)发布大语言模型驱动的中

不得不说,Llama2的「二创」项目越来越硬核、有趣了。自Meta发布开源大模型Llama2以来,围绕着该模型的「二创」项目便多了起来。此前7月,特斯拉前AI总监、重回OpenAI的AndrejKarpathy利用周末时间,做了一个关于Llama2的有趣项目llama2.c,让用户在PyTorch中训练一个babyLlama2模型,然后使用近500行纯C、无任何依赖性的文件进行推理。今天,在Karpathyllama2.c项目的基础上,又有开发者创建了一个启动Llama2的演示操作系统,以及一个

杭州第19届亚运会不仅是国际顶级体育盛会,更是一场精彩绝伦的中国科技盛宴。本届亚运会中,快手StreamLake与杭州电信深度合作,联合打造智慧观赛新体验,在击剑赛事的转播中,全面应用了快手StreamLake六自由度技术,其中“子弹时间”也是首次应用于击剑项目国际顶级赛事。中国电信杭州分公司智能亚运专班组长芮杰表示,依托快手StreamLake自研的4K3D虚拟运镜视频技术和中国电信5G/全光网,通过赛场内部署的4K专业摄像机阵列实时采集的高清竞赛视频,


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

SublimeText3 Linux新版
SublimeText3 Linux最新版

EditPlus 中文破解版
体积小,语法高亮,不支持代码提示功能

SublimeText3汉化版
中文版,非常好用

记事本++7.3.1
好用且免费的代码编辑器

Dreamweaver Mac版
视觉化网页开发工具