华人团队成功开发AI预测癌症患者适用药物，成果发表在Nature子刊上-人工智能-PHP中文网

首页

科技周边

人工智能

华人团队成功开发AI预测癌症患者适用药物，成果发表在Nature子刊上

PHPz

Apr 20, 2023 pm 09:43 PM

模块ai模型

只需一个AI，9808名癌症患者对药物的临床反应，全能预测。

而且结果和临床观察表现一致。

这就是由纽约市立大学Lei Xie团队带来的最新成果CODE-AE（context-aware deconfounding autoencoder）。

AI为人类开药方：准确预测9000名癌症患者适用药物！成果登上Nature子刊，出自华人团队

它提出一种新型的上下文自编码模型，可以预测不同患者对药物的特异性反应。

这将对新药开发和临床试验产生重大影响。

要知道，传统模式下一种新药开发、试验、完全上市，中间需要近10年的时间，消耗的资金也空前庞大，动辄就是10亿美元。

周期会如此之长，是因为新药在人体内的反应难以预测，往往需要反复试验进行测试。

而如果AI能够利用数据进行预测，将大幅缩短新药上市时间，降低成本。

目前，该研究登上Nature子刊《Nature Machine Intelligence》。

不再高度依赖临床数据

简单来说，CODE-AE是利用新药在体外细胞验证上的数据，来预测药物在人体身上会产生的反应。

这样就避免了AI模型训练对患者临床数据的依赖。

过去AI在临床反应预测上效果一直不算好的最大原因，便是想要收集海量、连续临床反应数据实在是太难了。

从机制上来看，研究人员将药物生物标志物分为了源域（source domain）和目标域（target domain）。

源域表示和测试样本不同的领域，但是有丰富的监督信息，在这里可以理解为体外细胞验证的数据。

目标域是测试样本所在的领域，无标签或只有少量标签，也就是患者数据。

AI为人类开药方：准确预测9000名癌症患者适用药物！成果登上Nature子刊，出自华人团队

将不同领域的数据特征映射到同一个特征空间，使其在该空间中的距离尽可能近。

于是在特征空间中对源域训练的目标函数，就可以迁移到目标域，提高目标域上的准确率。

放在该研究背景下，源域和目标域都是药物生物标志物的数据特征，即药物靶标的数据特征。

具体来看模型框架，主要分为三个部分：预训练、微调和推理。

预训练主要用了自监督学习，构建一个特征编码模块，将体外细胞数据和患者数据的未标记基因表达谱，映射到嵌入空间中。这样一来可以把一些混杂因素排除掉，让两种数据的潜入分布一致，以消除系统偏差。

微调阶段，是在预训练的基础上再加一个监督模型，并利用已经标记的体外细胞数据来进行训练。

最后在推理阶段，先从预训练中获得的患者去歧对其嵌入，然后再利用调优后的模型，来预测患者对药物的反应。

AI为人类开药方：准确预测9000名癌症患者适用药物！成果登上Nature子刊，出自华人团队

在这种模式下，CODE-AE具备两个特点。

第一，它可以提取不连贯样本中的常见生物信号和私有表示，从而排除掉由于数据模式不同带来的干扰。

第二，将药物响应信号和混杂因素分离后，还可以实现局部对齐。

总结来看，CODE-AE可以理解为在标记和无标记数据的非相干数据模式嵌入空间中，选择唯一特征的过程。

为了论证模型的有效性，研究人员对9808位癌症患者的药物适用情况进行预测。

如果模型对患者情况预测出的位点结果，和他使用的药物靶点有关，就证明预测是正确的。

然后，研究人员将患者分为100个聚类，将59种药物也分为30个聚类。

通过这种分析方法，可以让具有相似药物反应谱的患者被分在一起。

在此，我们以肺鳞状细胞癌患者（LSCC）和非小细胞肺癌患者（NSCLC）的聚类为例。

在59种药物中，LSCC最敏感的药物为吉非替尼、AICAR和吉西他滨。

其中吉非替尼、AICAR的作用靶点都是一种表皮生长因子受体(EGFR)，吉西他滨常被用于没有EGFR突变的非小细胞肺癌治疗。

论文表示，和这些药物作用模式一致，CODE-AE发现使用吉非替尼、AICAR的患者，药物反应图谱相似。

也就是说，CODE-AE发现了患者治疗的正确靶点，即可以预测适用药物。

AI为人类开药方：准确预测9000名癌症患者适用药物！成果登上Nature子刊，出自华人团队

通讯作者系中科大校友

如上研究团队来自纽约市立大学。

通讯作者为Lei Xie，他本科毕业于中国科学技术大学高分子物理专业。

硕士毕业于罗格斯大学计算机科学专业；博士同在罗格斯大学，但拿的是化学系学位。

AI为人类开药方：准确预测9000名癌症患者适用药物！成果登上Nature子刊，出自华人团队

据了解，该研究团队下一步将开发CODE-AE对新药临床反应在浓度、代谢方面的预测功能。

研究人员表示，该AI模型还有可能被调整为用于预测药物对人体的副作用影响。

值得一提的是，Nature子刊《Nature Machine Intelligence》专门关注人工智能和生命科学跨学科应用研究，每年收录论文平均数量在60篇左右。

论文地址：https://www.nature.com/articles/s42256-022-00541-0

参考链接：https://phys.org/news/2022-10-ai-accurately-human-response-drug.html

以上是华人团队成功开发AI预测癌症患者适用药物，成果发表在Nature子刊上的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文转载于：51CTO.COM。如有侵权，请联系admin@php.cn删除

外推指南Apr 15, 2025 am 11:38 AM

介绍假设有一个农民每天在几周内观察农作物的进展。他研究了增长率，并开始思考他的植物在几周内可以生长的高度。从Th

软AI的兴起及其对当今企业的意义Apr 15, 2025 am 11:36 AM

软AI（被定义为AI系统，旨在使用近似推理，模式识别和灵活的决策执行特定的狭窄任务 - 试图通过拥抱歧义来模仿类似人类的思维。但是这对业务意味着什么

为AI前沿的不断发展的安全框架Apr 15, 2025 am 11:34 AM

答案很明确 - 只是云计算需要向云本地安全工具转变，AI需要专门为AI独特需求而设计的新型安全解决方案。云计算和安全课程的兴起在

生成AI的3种方法放大了企业家：当心平均值！Apr 15, 2025 am 11:33 AM

企业家，并使用AI和Generative AI来改善其业务。同时，重要的是要记住生成的AI，就像所有技术一样，都是一个放大器 - 使得伟大和平庸，更糟。严格的2024研究O

Andrew Ng的新简短课程Apr 15, 2025 am 11:32 AM

解锁嵌入模型的力量：深入研究安德鲁·NG的新课程想象一个未来，机器可以完全准确地理解和回答您的问题。这不是科幻小说；多亏了AI的进步，它已成为R

大语言模型（LLM）中的幻觉是不可避免的吗？Apr 15, 2025 am 11:31 AM

大型语言模型（LLM）和不可避免的幻觉问题您可能使用了诸如Chatgpt，Claude和Gemini之类的AI模型。这些都是大型语言模型（LLM）的示例，在大规模文本数据集上训练的功能强大的AI系统

60％的问题 - AI搜索如何消耗您的流量Apr 15, 2025 am 11:28 AM

最近的研究表明，根据行业和搜索类型，AI概述可能导致有机交通下降15-64％。这种根本性的变化导致营销人员重新考虑其在数字可见性方面的整个策略。新的

麻省理工学院媒体实验室将人类蓬勃发展成为AI R＆D的核心Apr 15, 2025 am 11:26 AM

埃隆大学（Elon University）想象的数字未来中心的最新报告对近300名全球技术专家进行了调查。由此产生的报告“ 2035年成为人类”，得出的结论是，大多数人担心AI系统加深的采用

See all articles

热AI工具

热工具

MinGW - 适用于 Windows 的极简 GNU

这个项目正在迁移到osdn.net/projects/mingw的过程中，你可以继续在那里关注我们。MinGW：GNU编译器集合（GCC）的本地Windows移植版本，可自由分发的导入库和用于构建本地Windows应用程序的头文件；包括对MSVC运行时的扩展，以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

mPDF是一个PHP库，可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件，并处理不同的语言。与原始脚本如HTML2FPDF相比，它的速度较慢，并且在使用Unicode字体时生成的文件较大，但支持CSS样式等，并进行了大量增强。支持几乎所有语言，包括RTL（阿拉伯语和希伯来语）和CJK（中日韩）。支持嵌套的块级元素（如P、DIV），