Die Teams von Tencent und der Peking-Universität entwickelten Antikörper von Grund auf, trainierten vorab große Sprachmodelle und veröffentlichten sie im Nature-Unterjournal

王林

Aug 16, 2024 pm 10:32 PM

理论

Die Teams von Tencent und der Peking-Universität entwickelten Antikörper von Grund auf, trainierten vorab große Sprachmodelle und veröffentlichten sie im Nature-Unterjournal Herausgeber |. KX

Die KI-Technologie hat große Fortschritte bei der Unterstützung des Antikörperdesigns gemacht. Allerdings ist das Antikörperdesign immer noch stark auf die Isolierung antigenspezifischer Antikörper aus Serum angewiesen, was ein ressourcenintensiver und zeitaufwändiger Prozess ist.

Um dieses Problem zu lösen, schlug das Forschungsteam des Tencent AI Lab, der Peking University Shenzhen Graduate School und des Xijing Digestive Disease Hospital ein vorab trainiertes großes Sprachmodell zur Antikörpererzeugung (PALM-H3) für de vor Novo Generation Künstliche Antikörper CDRH3 mit der erforderlichen Antigenbindungsspezifität, wodurch die Abhängigkeit von natürlichen Antikörpern verringert wird.

Darüber hinaus wurde ein hochpräzises Antigen-Antikörper-Bindungsvorhersagemodell A2binder entwickelt, um die Antigen-Epitopsequenz mit der Antikörpersequenz abzugleichen und so die Bindungsspezifität und -affinität vorherzusagen.

Zusammenfassend lässt sich sagen, dass diese Studie ein künstliches Intelligenz-Framework für die Antikörpergenerierung und -bewertung etabliert, das das Potenzial hat, die Entwicklung von Antikörpermedikamenten erheblich zu beschleunigen.

Verwandte Forschung mit dem Titel „De-novo-Generierung des SARS-CoV-2-Antikörpers CDRH3 mit einem vorab trainierten generativen großen Sprachmodell“ wurde am 10. August veröffentlicht 🎜#Nature Communications".

Die Teams von Tencent und der Peking-Universität entwickelten Antikörper von Grund auf, trainierten vorab große Sprachmodelle und veröffentlichten sie im Nature-Unterjournal

Papierlink:

https://www.nature.com/articles/s41467-024-50903-y

Antikörpermedikamente, auch monoklonale Antikörper genannt, spielen eine wichtige Rolle in der biologischen Therapie. Durch die Nachahmung der Wirkung des Immunsystems können diese Medikamente gezielt Krankheitserreger wie Viren und Krebszellen bekämpfen. Antikörpermedikamente sind ein spezifischerer und wirksamerer Ansatz als herkömmliche Behandlungen. Antikörpermedikamente haben bei der Behandlung verschiedener Krankheiten positive Ergebnisse gezeigt.

Die Entwicklung von Antikörpermedikamenten ist ein komplexer Prozess, bei dem der Antikörper aus tierischen Quellen isoliert, humanisiert und seine Affinität optimiert wird. Doch die Entwicklung von Antikörper-Medikamenten basiert immer noch stark auf natürlichen Antikörpern.

Die Sequenzdaten eines Proteins können als Sprache betrachtet werden, daher wurden groß angelegte vorab trainierte Modelle im Bereich der Verarbeitung natürlicher Sprache (NLP) verwendet, um Darstellungsmuster von Proteinen zu lernen. Es wurden verschiedene Proteinsprachmodelle entwickelt. Allerdings bleibt die Erzeugung von Antikörpern mit hoher Affinität für bestimmte Epitope aufgrund der großen Vielfalt an Antikörpern und der Knappheit verfügbarer Daten zur Antigen-Antikörper-Paarung eine anspruchsvolle Aufgabe.

Um die oben genannten Herausforderungen zu bewältigen, schlug das Tencent AI Lab-Team das vorab trainierte große Sprachmodell PALM-H3 zur Antikörpererzeugung vor, das zur Optimierung und Generierung der die Komplementarität der schweren Kette bestimmenden Region 3 verwendet wird ( CDRH3), wobei Spezifität und Diversität des Antikörpers eine entscheidende Rolle spielen.

Um die Affinität von PALM-H3-generierten Antikörpern für Antigene zu bewerten, verwendeten die Forscher eine Kombination aus Antigen-Antikörper-Docking und KI-basierten Methoden.

Die Forscher entwickelten außerdem A2binder zur Beurteilung der Antikörper-Antigen-Affinität. A2binder ermöglicht genaue und verallgemeinerbare Affinitätsvorhersagen, selbst für unbekannte Antigene.

Das Framework von PALM-H3 und A2Binder

Der Workflow und das Modell-Framework von PALM-H3 und A2Binder sind in der folgenden Abbildung dargestellt.

Die Teams von Tencent und der Peking-Universität entwickelten Antikörper von Grund auf, trainierten vorab große Sprachmodelle und veröffentlichten sie im Nature-Unterjournal

Abbildung: PALM-H3- und A2binder-Workflow-Übersicht. (Quelle: Paper)

PALM-H3 wurde entwickelt, um De-novo-CDRH3-Sequenzen in Antikörpern zu erzeugen. Die CDRH3-Region spielt die wichtigste Rolle bei der Bestimmung der Bindungsspezifität von Antikörpern für bestimmte Antigensequenzen. PALM-H3 ist ein transformatorähnliches Modell, das ein ESM2-basiertes Antigenmodell als Encoder und einen Antikörper-Roformer als Decoder verwendet. Die Studie entwickelte auch A2binder, um die Bindungsaffinität künstlich erzeugter Antikörper vorherzusagen.

Die Konstruktion von PALM-H3 und A2binder umfasst drei Schritte: Zunächst trainierten die Forscher zwei Roformer auf ungepaarten Antikörper-Schwerketten- bzw. Leichtkettensequenzen im Modell. Anschließend wurde A2binder auf der Grundlage von vorab trainiertem ESM2, Antikörper-Schwerkette-Roformer und Antikörper-Leichtkette-Roformer erstellt und mithilfe gepaarter Affinitätsdaten trainiert. Schließlich wurde PALM-H3 unter Verwendung von vortrainiertem ESM2 und Antikörper-Schwerkette-Roformer erstellt und auf gepaarten Antigen-CDRH3-Daten trainiert, um CDRH3 de novo zu erzeugen. A2binder kann die Wahrscheinlichkeit der Antigen-Antikörper-Bindung und die Affinität seiner Leistung genau vorhersagen.

A2binder schneidet beim Affinitätsdatensatz gut ab, teilweise aufgrund des Vortrainings auf Antikörpersequenzen, das es A2binder ermöglicht, die in diesen Sequenzen vorhandenen einzigartigen Muster zu lernen.

圖示：預訓練和未訓練模型的潛在能力比較以及 A2Binder 與基線方法在抗體-抗原結合特異性預測方面的性能比較。（資料來源：論文）

結果表明，在所有抗原抗體親和力預測資料集上，A2binder 的表現均優於基線模型ESM-F（後者俱有相同的框架，但預訓練模型被ESM2 取代），這表明使用抗體序列進行預訓練可能對相關的下游任務有益。

為了評估模型在預測親和力值方面的表現，研究人員也利用了兩個包含親和力值標籤的資料集 14H 和 14L。

Die Teams von Tencent und der Peking-Universität entwickelten Antikörper von Grund auf, trainierten vorab große Sprachmodelle und veröffentlichten sie im Nature-Unterjournal

A2binder 在 Pearson 相關性和 Spearman 相關性指標上均優於所有基線模型。 A2binder 在 14H 資料集上實現了 0.642 的 Pearson 相關性（提高了 3%），在 14L 資料集上實現了 0.683（提高了 1%）。

然而，與其他資料集相比，A2binder 和其他基準模型在 14H 和 14L 資料集上的表現略有下降。這項觀察結果與先前的研究一致。

PALM-H3 在生成高結合機率抗體方面表現優異

研究人員探討了 PALM-H3 產生的抗體與天然抗體之間的差異。發現它們的序列有顯著差異，但產生的抗體的結合機率並沒有受到這些差異的顯著影響。同時，它們的結構差異確實導致結合親和力的下降。這些結果與先前關於抗體庫網絡分析和功能性蛋白質序列生成的研究一致。

Die Teams von Tencent und der Peking-Universität entwickelten Antikörper von Grund auf, trainierten vorab große Sprachmodelle und veröffentlichten sie im Nature-Unterjournal

圖示：與基線方法的性能比較以及人工抗體和天然抗體的相似性分析。（資料來源：論文）

總體而言，結果表明，儘管與天然抗體不同，但 PALM-H3 能夠產生具有高結合親和力的多種抗體序列。

此外，研究人員透過 ClusPro 和 SnugDock 驗證了 PALM-H3 的性能。 PALM-H3 能夠產生針對 SARS-CoV-2 HR2 區穩定勝肽的抗體 CDRH3 序列。它產生了新的 CDRH3 序列，並且驗證了產生的序列 GRREAAWALA 與天然 CDHR3 序列 GKAAGTFDS 相比，對抗原穩定勝肽的標靶性有所改善。

Die Teams von Tencent und der Peking-Universität entwickelten Antikörper von Grund auf, trainierten vorab große Sprachmodelle und veröffentlichten sie im Nature-Unterjournal

圖示：A2binder 預測的選定高親和力人工抗體與針對 SARS-CoV-2 刺突蛋白的天然抗體在不同變體和計算結構生成方法之間的界面能比較。（資料來源：論文）

此外，PALM-H3 能夠產生對新出現的 SARS-CoV-2 變體 XBB 具有更高親和力的抗體 CDRH3 序列。產生的序列 AKDSRTSPLRLDYS 對 XBB 的親和力比其來源 ASEVLDNLRDGYNF 更強。

此外，PALM-H3 不僅克服了傳統順序突變策略面臨的局部最優陷阱，而且與 E-EVO 方法相比，它還能產生具有更高抗原結合親和力的抗體。這凸顯了 PALM-H3 在抗體設計方面的優勢，能夠更有效地探索序列空間並產生針對特定表位的高親和力結合物。

體外實驗

此外，研究人員還進行了體外試驗，包括蛋白質印跡、表面等離子體共振分析和假病毒中和試驗，為 PALM-H3 設計抗體的有效性提供了關鍵驗證。

Die Teams von Tencent und der Peking-Universität entwickelten Antikörper von Grund auf, trainierten vorab große Sprachmodelle und veröffentlichten sie im Nature-Unterjournal

圖示：人工和天然抗體的結合親和力和中和性的體外試驗。（資料來源：論文）

PALM-H3 產生的針對SARS-CoV-2 野生型、Alpha、Delta 和XBB 變體刺突蛋白的兩種抗體在這些試驗中都實現了比天然抗體更高的結合親和力和中和效力。這些濕實驗室實驗的有力經驗結果補充了計算預測和分析，驗證了 PALM-H3 和 A2binder 在生成和選擇對已知和新抗原具有高特異性和親和力的強效抗體方面的能力。

總之，提出的 PALM-H3 整合了大規模抗體預訓練的能力和全局特徵融合的有效性，從而具有卓越的親和力預測性能和設計高親和力抗體的能力。此外，直接序列產生和可解釋的權重視覺化使其成為設計高親和力抗體的有效且可解釋的工具。

Das obige ist der detaillierte Inhalt vonDie Teams von Tencent und der Peking-Universität entwickelten Antikörper von Grund auf, trainierten vorab große Sprachmodelle und veröffentlichten sie im Nature-Unterjournal. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Verwandter Artikel

五个时间序列预测的深度学习模型对比总结May 05, 2023 pm 05:16 PM

MakridakisM-Competitions系列（分别称为M4和M5）分别在2018年和2020年举办（M6也在今年举办了）。对于那些不了解的人来说，m系列得比赛可以被认为是时间序列生态系统的一种现有状态的总结，为当前得预测的理论和实践提供了经验和客观的证据。2018年M4的结果表明，纯粹的“ML”方法在很大程度上胜过传统的统计方法，这在当时是出乎意料的。在两年后的M5[1]中，最的高分是仅具有“ML”方法。并且所有前50名基本上都是基于ML的（大部分是树型模型）。这场比赛看到了LightG

RLHF与AlphaGo核心技术强强联合，UW/Meta让文本生成能力再上新台阶Oct 27, 2023 pm 03:13 PM

在一项最新的研究中，来自UW和Meta的研究者提出了一种新的解码算法，将AlphaGo采用的蒙特卡洛树搜索算法（Monte-CarloTreeSearch,MCTS）应用到经过近端策略优化（ProximalPolicyOptimization,PPO）训练的RLHF语言模型上，大幅提高了模型生成文本的质量。PPO-MCTS算法通过探索与评估若干条候选序列，搜索到更优的解码策略。通过PPO-MCTS生成的文本能更好满足任务要求。论文链接：https://arxiv.org/pdf/2309.150

MIT团队运用机器学习闭环自主分子发现平台，成功发现、合成和描述了303种新分子Jan 04, 2024 pm 05:38 PM

编辑|X传统意义上，发现所需特性的分子过程一直是由手动实验、化学家的直觉以及对机制和第一原理的理解推动的。随着化学家越来越多地使用自动化设备和预测合成算法，自主研究设备越来越接近实现。近日，来自MIT的研究人员开发了由集成机器学习工具驱动的闭环自主分子发现平台，以加速具有所需特性的分子的设计。无需手动实验即可探索化学空间并利用已知的化学结构。在两个案例研究中，该平台尝试了3000多个反应，其中1000多个产生了预测的反应产物，提出、合成并表征了303种未报道的染料样分子。该研究以《Autonom

AI助力脑机接口研究，纽约大学突破性神经语音解码技术，登Nature子刊Apr 17, 2024 am 08:40 AM

作者|陈旭鹏编辑|ScienceAI由于神经系统的缺陷导致的失语会导致严重的生活障碍，它可能会限制人们的职业和社交生活。近年来，深度学习和脑机接口（BCI）技术的飞速发展为开发能够帮助失语者沟通的神经语音假肢提供了可行性。然而，神经信号的语音解码面临挑战。近日，约旦大学VideoLab和FlinkerLab的研究者开发了一个新型的可微分语音合成器，可以利用一个轻型的卷积神经网络将语音编码为一系列可解释的语音参数（例如音高、响度、共振峰频率等），并通过可微分神经网络将这些参数合成为语音。这个合成器

Code Llama代码能力飙升，微调版HumanEval得分超越GPT-4，一天发布Aug 26, 2023 pm 09:01 PM

昨天，Meta开源专攻代码生成的基础模型CodeLlama，可免费用于研究以及商用目的。CodeLlama系列模型有三个参数版本，参数量分别为7B、13B和34B。并且支持多种编程语言，包括Python、C++、Java、PHP、Typescript(Javascript)、C#和Bash。Meta提供的CodeLlama版本包括：代码Llama，基础代码模型；代码羊-Python，Python微调版本；代码Llama-Instruct，自然语言指令微调版就其效果来说，CodeLlama的不同版

准确率 >98%，基于电子密度的 GPT 用于化学研究，登 Nature 子刊Mar 27, 2024 pm 02:16 PM

编辑|紫罗可合成分子的化学空间是非常广阔的。有效地探索这个领域需要依赖计算筛选技术，比如深度学习，以便快速地发现各种有趣的化合物。将分子结构转换为数字表示形式，并开发相应算法生成新的分子结构是进行化学发现的关键。最近，英国格拉斯哥大学的研究团队提出了一种基于电子密度训练的机器学习模型，用于生成主客体binders。这种模型能够以简化分子线性输入规范（SMILES）格式读取数据，准确率高达98%，从而实现对分子在二维空间的全面描述。通过变分自编码器生成主客体系统的电子密度和静电势的三维表示，然后通

手机摄影技术让以假乱真的好莱坞级电影特效视频走红Sep 07, 2023 am 09:41 AM

一个普通人用一台手机就能制作电影特效的时代已经来了。最近，一个名叫Simulon的3D技术公司发布了一系列特效视频，视频中的3D机器人与环境无缝融合，而且光影效果非常自然。呈现这些效果的APP也叫Simulon，它能让使用者通过手机摄像头的实时拍摄，直接渲染出CGI（计算机生成图像）特效，就跟打开美颜相机拍摄一样。在具体操作中，你要先上传一个3D模型（比如图中的机器人）。Simulon会将这个模型放置到你拍摄的现实世界中，并使用准确的照明、阴影和反射效果来渲染它们。整个过程不需要相机解算、HDR

谷歌用大型模型训练机器狗理解模糊指令，激动不已准备去野餐Jan 16, 2024 am 11:24 AM

人类和四足机器人之间简单有效的交互是创造能干的智能助理机器人的途径，其昭示着这样一个未来：技术以超乎我们想象的方式改善我们的生活。对于这样的人类-机器人交互系统，关键是让四足机器人有能力响应自然语言指令。近来大型语言模型（LLM）发展迅速，已经展现出了执行高层规划的潜力。然而，对LLM来说，理解低层指令依然很难，比如关节角度目标或电机扭矩，尤其是对于本身就不稳定、必需高频控制信号的足式机器人。因此，大多数现有工作都会假设已为LLM提供了决定机器人行为的高层API，而这就从根本上限制了系统的表现能

See all articles

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)

2 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌

Repo: Wie man Teamkollegen wiederbelebt

4 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌

Hello Kitty Island Abenteuer: Wie man riesige Samen bekommt

3 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌

Wie lange dauert es, um Split Fiction zu schlagen?

3 Wochen vorByDDD

R.E.P.O. Dateispeicherspeicherort: Wo ist es und wie schützt sie?

3 Wochen vorByDDD

Heiße Werkzeuge

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

SublimeText3 Linux neue Version

SublimeText3 Linux neueste Version

SecLists

SecLists ist der ultimative Begleiter für Sicherheitstester. Dabei handelt es sich um eine Sammlung verschiedener Arten von Listen, die häufig bei Sicherheitsbewertungen verwendet werden, an einem Ort. SecLists trägt dazu bei, Sicherheitstests effizienter und produktiver zu gestalten, indem es bequem alle Listen bereitstellt, die ein Sicherheitstester benötigen könnte. Zu den Listentypen gehören Benutzernamen, Passwörter, URLs, Fuzzing-Payloads, Muster für vertrauliche Daten, Web-Shells und mehr. Der Tester kann dieses Repository einfach auf einen neuen Testcomputer übertragen und hat dann Zugriff auf alle Arten von Listen, die er benötigt.