検索
ホームページテクノロジー周辺機器AIテンセントと北京大学のチームは抗体をゼロから設計し、大規模な言語モデルを事前トレーニングし、Nature サブジャーナルに発表しました。

テンセントと北京大学のチームは抗体をゼロから設計し、大規模な言語モデルを事前トレーニングし、Nature サブジャーナルに発表しました。編集者 | KX

AIテクノロジーは抗体設計の支援において大きな進歩を遂げました。しかし、抗体設計は依然として血清からの抗原特異的抗体の単離に大きく依存しており、これはリソースを大量に消費し、時間のかかるプロセスです。

この問題を解決するために、Tencent AI Lab、北京大学深セン大学院、西京消化器病病院の研究チームは、必要な抗原結合特異性を実現する独自の人工抗体 CDRH3 は、天然抗体への依存を軽減します。

さらに、高精度の抗原抗体結合予測モデル A2binder は、抗原エピトープ配列と抗体配列を照合して結合特異性と親和性を予測するように設計されました。

要約すると、この研究は抗体生成と評価のための人工知能フレームワークを確立し、抗体医薬品の開発を大幅に加速する可能性があります。

関連研究「事前学習済み生成大規模言語モデルによるSARS-CoV-2抗体CDRH3のDe novo生成」が、8月10日付けの「Nature Communications」に掲載されました。

テンセントと北京大学のチームは抗体をゼロから設計し、大規模な言語モデルを事前トレーニングし、Nature サブジャーナルに発表しました。

論文リンク: https://www.nature.com/articles/s41467-024-50903-y

モノクローナル抗体としても知られる抗体医薬品は、生物学的療法の効果において重要な役割を果たします。これらの薬剤は、免疫系の作用を模倣することで、ウイルスやがん細胞などの病気の原因物質を選択的に標的にすることができます。抗体医薬は、従来の治療法よりも特異的かつ効果的なアプローチです。抗体医薬はさまざまな病気の治療において良い結果を示しています。

抗体医薬品の開発は、動物源からの抗体の単離、ヒト化、その親和性の最適化を含む複雑なプロセスです。しかし、抗体医薬品の開発は依然として天然抗体に大きく依存しています。

タンパク質の配列データは言語として見ることができるため、自然言語処理 (NLP) の分野における大規模な事前トレーニング済みモデルがタンパク質の表現パターンを学習するために使用されてきました。さまざまなタンパク質言語モデルが開発されています。しかし、抗体の多様性が高く、入手可能な抗原抗体対データが不足しているため、特定のエピトープに対して高い親和性を持つ抗体を生成することは依然として困難な課題です。

上記の課題に対処するために、Tencent AI Lab チームは、重要な役割を果たす重鎖相補性決定領域 3 (CDRH3) を最適化して生成するための、事前トレーニング済み抗体生成大規模言語モデル PALM-H3 を提案しました。抗体の特異性と多様性において重要な役割を果たします。

PALM-H3 によって生成された抗体の抗原に対する親和性を評価するために、研究者らは抗原抗体ドッキングと AI ベースの方法を組み合わせて使用​​しました。

研究者らは、抗体抗原親和性を評価するための A2binder も開発しました。 A2binder は、未知の抗原であっても、正確かつ一般化可能な親和性予測を可能にします。

PALM-H3とA2Binderのフレームワーク

PALM-H3とA2binderのワークフローとモデルフレームワークを下図に示します。

テンセントと北京大学のチームは抗体をゼロから設計し、大規模な言語モデルを事前トレーニングし、Nature サブジャーナルに発表しました。

イラスト: PALM-H3 と A2binder のワークフローの概要。 (出典: 論文)

PALM-H3 は、抗体で新たに CDRH3 配列を生成するように設計されています。 CDRH3 領域は、特定の抗原配列に対する抗体の結合特異性を決定する際に最も重要な役割を果たします。 PALM-H3 は、ESM2 ベースの抗原モデルをエンコーダーとして、抗体 Roformer をデコーダーとして使用するトランスフォーマーのようなモデルです。この研究では、人工的に生成された抗体の結合親和性を予測するための A2binder も構築されました。

PALM-H3 と A2binder の構築には 3 つのステップが含まれていました: まず、研究者らは、不対抗体重鎖配列と軽鎖配列でそれぞれ 2 つの Roformer モデルを事前トレーニングしました。次に、事前トレーニング済みの ESM2、抗体重鎖 Roformer、および抗体軽鎖 Roformer に基づいて A2binder を構築し、ペアのアフィニティー データを使用してトレーニングしました。最後に、事前トレーニングされた ESM2 と抗体重鎖 Roformer を使用して PALM-H3 を構築し、対の抗原 CDRH3 データでトレーニングして CDRH3 を新たに生成しました。

A2binder は抗原抗体結合確率、親和性を正確に予測できます

A2binder のパフォーマンスは、親和性を予測する能力をいくつかのベースライン方法と比較することによって評価されました。

A2binder は、抗体配列の事前トレーニングにより、アフィニティー データセットで良好なパフォーマンスを発揮します。これにより、A2binder は、これらの配列に存在する固有のパターンを学習できるようになります。

テンセントと北京大学のチームは抗体をゼロから設計し、大規模な言語モデルを事前トレーニングし、Nature サブジャーナルに発表しました。

Illustration : Comparaison des capacités potentielles de modèles pré-entraînés et non entraînés et comparaison des performances d'A2Binder et des méthodes de base pour prédire la spécificité de liaison anticorps-antigène. (Source : article)

Les résultats montrent qu'A2binder fonctionne mieux que le modèle de base ESM-F sur tous les ensembles de données de prédiction d'affinité antigène-anticorps (ce dernier a le même cadre, mais le modèle pré-entraîné est la substitution ESM2), ce qui suggère que le pré-entraînement avec des séquences d'anticorps peut être bénéfique pour les tâches connexes en aval.

Pour évaluer les performances du modèle dans la prédiction des valeurs d'affinité, les chercheurs ont également utilisé deux ensembles de données, 14H et 14L, qui contiennent des étiquettes de valeurs d'affinité.

テンセントと北京大学のチームは抗体をゼロから設計し、大規模な言語モデルを事前トレーニングし、Nature サブジャーナルに発表しました。

A2binder surpasse tous les modèles de base sur les mesures de corrélation de Pearson et de corrélation de Spearman. A2binder atteint une corrélation de Pearson de 0,642 sur l'ensemble de données 14H (une amélioration de 3 %) et de 0,683 sur l'ensemble de données 14L (une amélioration de 1 %).

Cependant, les performances d'A2binder et d'autres modèles de base ont légèrement diminué sur les ensembles de données 14H et 14L par rapport aux autres ensembles de données. Cette observation est cohérente avec les études précédentes.

PALM-H3 excelle dans la génération d'anticorps à forte probabilité de liaison

Les chercheurs ont exploré la différence entre les anticorps produits par PALM-H3 et les anticorps naturels anticorps. différence entre. Leurs séquences différaient de manière significative, mais les probabilités de liaison des anticorps produits n’étaient pas significativement affectées par ces différences. Dans le même temps, leurs différences structurelles conduisent à une diminution de l’affinité de liaison. Ces résultats sont cohérents avec des études antérieures sur l’analyse de réseau de bibliothèques d’anticorps et la génération de séquences protéiques fonctionnelles.

テンセントと北京大学のチームは抗体をゼロから設計し、大規模な言語モデルを事前トレーニングし、Nature サブジャーナルに発表しました。

Illustration : Comparaison des performances avec les méthodes de base et analyse de similarité des anticorps artificiels et naturels. (Source : article)

Dans l'ensemble, les résultats montrent que PALM-H3 est capable de générer une gamme diversifiée de séquences d'anticorps avec des affinités de liaison élevées, bien que contrairement aux anticorps naturels.

De plus, les chercheurs ont vérifié les performances du PALM-H3 via ClusPro et SnugDock. PALM-H3 est capable de générer des anticorps contre la séquence CDRH3 du peptide stabilisant la région HR2 du SRAS-CoV-2. Il a généré une nouvelle séquence CDRH3 et a validé que la séquence générée GRREAAWALA avait amélioré le ciblage des peptides stabilisant l'antigène par rapport à la séquence CDHR3 native GKAAGTFDS.

テンセントと北京大学のチームは抗体をゼロから設計し、大規模な言語モデルを事前トレーニングし、Nature サブジャーナルに発表しました。

Illustration : A2binder a prédit des anticorps artificiels sélectionnés de haute affinité par rapport aux anticorps naturels contre la protéine de pointe du SRAS-CoV-2 dans différentes variantes et des comparaisons d'énergie d'interface entre méthodes de génération de structures informatiques. (Source : article)

De plus, PALM-H3 est capable de générer des anticorps avec une affinité plus élevée contre la séquence émergente XBB CDRH3 du variant SARS-CoV-2. La séquence résultante AKDSRTSPLRLDYS a une affinité plus forte pour XBB que sa source, ASEVLDNLRDGYNF.

De plus, PALM-H3 surmonte non seulement les pièges optimaux locaux auxquels sont confrontées les stratégies traditionnelles de mutation séquentielle, mais il génère également des anticorps avec une affinité de liaison à l'antigène plus élevée que l'approche E-EVO. Ceci met en valeur les avantages de PALM-H3 dans la conception d’anticorps, permettant une exploration plus efficace de l’espace des séquences et la génération de liants de haute affinité ciblant des épitopes spécifiques.

Expériences in vitro

En outre, les chercheurs ont également mené des expériences in vitro, notamment le Western blot, l'analyse par résonance plasmonique de surface et la neutralisation des pseudovirus. L’expérience a fourni une vérification clé de l’efficacité de l’anticorps conçu par PALM-H3.

テンセントと北京大学のチームは抗体をゼロから設計し、大規模な言語モデルを事前トレーニングし、Nature サブジャーナルに発表しました。

Illustration : Test in vitro d'affinité de liaison et de neutralisation des anticorps artificiels et naturels. (Source : article)

PALM-H3 Deux anticorps générés contre les protéines de pointe des variantes de type sauvage du SRAS-CoV-2, Alpha, Delta et XBB, ont atteint des niveaux plus élevés que les niveaux natifs dans ces essais. Une affinité de liaison plus élevée et pouvoir neutralisant des anticorps. Les résultats empiriques robustes de ces expériences en laboratoire humide complètent les prédictions et analyses informatiques, validant la capacité de PALM-H3 et A2binder à générer et à sélectionner des anticorps puissants avec une spécificité et une affinité élevées pour les antigènes connus et nouveaux.

En résumé, le PALM-H3 proposé intègre la capacité de pré-entraînement d'anticorps à grande échelle et l'efficacité de la fusion globale de caractéristiques, ce qui se traduit par d'excellentes performances de prédiction d'affinité et la capacité de concevoir des anticorps de haute affinité . De plus, la génération directe de séquences et la visualisation interprétable du poids en font un outil efficace et interprétable pour concevoir des anticorps de haute affinité.

以上がテンセントと北京大学のチームは抗体をゼロから設計し、大規模な言語モデルを事前トレーニングし、Nature サブジャーナルに発表しました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
五个时间序列预测的深度学习模型对比总结五个时间序列预测的深度学习模型对比总结May 05, 2023 pm 05:16 PM

MakridakisM-Competitions系列(分别称为M4和M5)分别在2018年和2020年举办(M6也在今年举办了)。对于那些不了解的人来说,m系列得比赛可以被认为是时间序列生态系统的一种现有状态的总结,为当前得预测的理论和实践提供了经验和客观的证据。2018年M4的结果表明,纯粹的“ML”方法在很大程度上胜过传统的统计方法,这在当时是出乎意料的。在两年后的M5[1]中,最的高分是仅具有“ML”方法。并且所有前50名基本上都是基于ML的(大部分是树型模型)。这场比赛看到了LightG

RLHF与AlphaGo核心技术强强联合,UW/Meta让文本生成能力再上新台阶RLHF与AlphaGo核心技术强强联合,UW/Meta让文本生成能力再上新台阶Oct 27, 2023 pm 03:13 PM

在一项最新的研究中,来自UW和Meta的研究者提出了一种新的解码算法,将AlphaGo采用的蒙特卡洛树搜索算法(Monte-CarloTreeSearch,MCTS)应用到经过近端策略优化(ProximalPolicyOptimization,PPO)训练的RLHF语言模型上,大幅提高了模型生成文本的质量。PPO-MCTS算法通过探索与评估若干条候选序列,搜索到更优的解码策略。通过PPO-MCTS生成的文本能更好满足任务要求。论文链接:https://arxiv.org/pdf/2309.150

MIT团队运用机器学习闭环自主分子发现平台,成功发现、合成和描述了303种新分子MIT团队运用机器学习闭环自主分子发现平台,成功发现、合成和描述了303种新分子Jan 04, 2024 pm 05:38 PM

编辑|X传统意义上,发现所需特性的分子过程一直是由手动实验、化学家的直觉以及对机制和第一原理的理解推动的。随着化学家越来越多地使用自动化设备和预测合成算法,自主研究设备越来越接近实现。近日,来自MIT的研究人员开发了由集成机器学习工具驱动的闭环自主分子发现平台,以加速具有所需特性的分子的设计。无需手动实验即可探索化学空间并利用已知的化学结构。在两个案例研究中,该平台尝试了3000多个反应,其中1000多个产生了预测的反应产物,提出、合成并表征了303种未报道的染料样分子。该研究以《Autonom

Code Llama代码能力飙升,微调版HumanEval得分超越GPT-4,一天发布Code Llama代码能力飙升,微调版HumanEval得分超越GPT-4,一天发布Aug 26, 2023 pm 09:01 PM

昨天,Meta开源专攻代码生成的基础模型CodeLlama,可免费用于研究以及商用目的。CodeLlama系列模型有三个参数版本,参数量分别为7B、13B和34B。并且支持多种编程语言,包括Python、C++、Java、PHP、Typescript(Javascript)、C#和Bash。Meta提供的CodeLlama版本包括:代码Llama,基础代码模型;代码羊-Python,Python微调版本;代码Llama-Instruct,自然语言指令微调版就其效果来说,CodeLlama的不同版

AI助力脑机接口研究,纽约大学突破性神经语音解码技术,登Nature子刊AI助力脑机接口研究,纽约大学突破性神经语音解码技术,登Nature子刊Apr 17, 2024 am 08:40 AM

作者|陈旭鹏编辑|ScienceAI由于神经系统的缺陷导致的失语会导致严重的生活障碍,它可能会限制人们的职业和社交生活。近年来,深度学习和脑机接口(BCI)技术的飞速发展为开发能够帮助失语者沟通的神经语音假肢提供了可行性。然而,神经信号的语音解码面临挑战。近日,约旦大学VideoLab和FlinkerLab的研究者开发了一个新型的可微分语音合成器,可以利用一个轻型的卷积神经网络将语音编码为一系列可解释的语音参数(例如音高、响度、共振峰频率等),并通过可微分神经网络将这些参数合成为语音。这个合成器

准确率 >98%,基于电子密度的 GPT 用于化学研究,登 Nature 子刊准确率 >98%,基于电子密度的 GPT 用于化学研究,登 Nature 子刊Mar 27, 2024 pm 02:16 PM

编辑|紫罗可合成分子的化学空间是非常广阔的。有效地探索这个领域需要依赖计算筛选技术,比如深度学习,以便快速地发现各种有趣的化合物。将分子结构转换为数字表示形式,并开发相应算法生成新的分子结构是进行化学发现的关键。最近,英国格拉斯哥大学的研究团队提出了一种基于电子密度训练的机器学习模型,用于生成主客体binders。这种模型能够以简化分子线性输入规范(SMILES)格式读取数据,准确率高达98%,从而实现对分子在二维空间的全面描述。通过变分自编码器生成主客体系统的电子密度和静电势的三维表示,然后通

手机摄影技术让以假乱真的好莱坞级电影特效视频走红手机摄影技术让以假乱真的好莱坞级电影特效视频走红Sep 07, 2023 am 09:41 AM

一个普通人用一台手机就能制作电影特效的时代已经来了。最近,一个名叫Simulon的3D技术公司发布了一系列特效视频,视频中的3D机器人与环境无缝融合,而且光影效果非常自然。呈现这些效果的APP也叫Simulon,它能让使用者通过手机摄像头的实时拍摄,直接渲染出CGI(计算机生成图像)特效,就跟打开美颜相机拍摄一样。在具体操作中,你要先上传一个3D模型(比如图中的机器人)。Simulon会将这个模型放置到你拍摄的现实世界中,并使用准确的照明、阴影和反射效果来渲染它们。整个过程不需要相机解算、HDR

谷歌用大型模型训练机器狗理解模糊指令,激动不已准备去野餐谷歌用大型模型训练机器狗理解模糊指令,激动不已准备去野餐Jan 16, 2024 am 11:24 AM

人类和四足机器人之间简单有效的交互是创造能干的智能助理机器人的途径,其昭示着这样一个未来:技术以超乎我们想象的方式改善我们的生活。对于这样的人类-机器人交互系统,关键是让四足机器人有能力响应自然语言指令。近来大型语言模型(LLM)发展迅速,已经展现出了执行高层规划的潜力。然而,对LLM来说,理解低层指令依然很难,比如关节角度目标或电机扭矩,尤其是对于本身就不稳定、必需高频控制信号的足式机器人。因此,大多数现有工作都会假设已为LLM提供了决定机器人行为的高层API,而这就从根本上限制了系统的表现能

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

EditPlus 中国語クラック版

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

Dreamweaver Mac版

Dreamweaver Mac版

ビジュアル Web 開発ツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

VSCode Windows 64 ビットのダウンロード

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター