Rumah >Peranti teknologi >AI >Mereka bentuk antibodi dari awal, pasukan Tencent dan Universiti Peking telah melatih model bahasa besar dan menerbitkannya dalam sub-jurnal Nature
Editor |. Teknologi KX
AI telah mencapai kemajuan besar dalam membantu reka bentuk antibodi. Walau bagaimanapun, reka bentuk antibodi masih banyak bergantung pada pengasingan antibodi khusus antigen daripada serum, yang merupakan proses intensif sumber dan memakan masa.
Untuk menyelesaikan masalah ini, pasukan penyelidik Tencent AI Lab, Peking University Shenzhen Graduate School dan Xijing Digestive Disease Hospital mencadangkan model bahasa besar generasi antibodi terlatih (PALM-H3) untuk penjanaan de novo antibodi dengan kekhususan pengikatan antigen yang diperlukan Antibodi buatan yang unik CDRH3 mengurangkan pergantungan kepada antibodi semula jadi.
Selain itu, model ramalan pengikat antigen-antibodi berketepatan tinggi A2binder direka untuk memadankan jujukan epitop antigen dengan jujukan antibodi untuk meramalkan kekhususan dan pertalian pengikatan.
Ringkasnya, kajian ini mewujudkan rangka kerja kecerdasan buatan untuk penjanaan dan penilaian antibodi, yang berpotensi untuk mempercepatkan pembangunan ubat antibodi dengan ketara.
Penyelidikan berkaitan bertajuk "Generasi de novo antibodi SARS-CoV-2 CDRH3 dengan model bahasa besar generatif terlatih" telah diterbitkan dalam "Nature Communications" pada 10 Ogos.
Ubat antibodi, juga dikenali sebagai antibodi monoklonal, memainkan peranan penting dalam kesan terapi biologi. Dengan meniru tindakan sistem imun, ubat-ubatan ini secara terpilih boleh menyasarkan agen penyebab penyakit seperti virus dan sel kanser. Ubat antibodi adalah pendekatan yang lebih spesifik dan berkesan daripada rawatan tradisional. Ubat antibodi telah menunjukkan hasil yang positif dalam merawat pelbagai penyakit.
Membangunkan ubat antibodi ialah proses kompleks yang melibatkan pengasingan antibodi daripada sumber haiwan, memanusiakannya dan mengoptimumkan pertaliannya. Tetapi perkembangan ubat antibodi masih banyak bergantung pada antibodi semula jadi.
Data jujukan protein boleh dilihat sebagai bahasa, jadi model pra-latihan berskala besar dalam bidang pemprosesan bahasa semula jadi (NLP) telah digunakan untuk mempelajari corak perwakilan protein. Pelbagai model bahasa protein telah dibangunkan. Walau bagaimanapun, menjana antibodi dengan pertalian tinggi untuk epitop tertentu kekal sebagai tugas yang mencabar kerana kepelbagaian antibodi yang tinggi dan kekurangan data pasangan antigen-antibodi yang tersedia.
Untuk menangani cabaran di atas, pasukan Tencent AI Lab mencadangkan model bahasa berskala besar generasi antibodi terlatih PALM-H3 untuk mengoptimumkan dan menjana rantau penentu kesempurnaan rantaian berat 3 (CDRH3), yang memainkan peranan penting dalam kekhususan dan kepelbagaian antibodi memainkan peranan yang penting.
Untuk menilai pertalian antibodi yang dihasilkan oleh PALM-H3 untuk antigen, para penyelidik menggunakan gabungan dok antigen-antibodi dan kaedah berasaskan AI.
Para penyelidik juga membangunkan A2binder untuk menilai pertalian antibodi-antigen. A2binder membolehkan ramalan pertalian yang tepat dan boleh digeneralisasikan, walaupun untuk antigen yang tidak diketahui.
Aliran kerja dan rangka kerja model PALM-H3 dan A2binder ditunjukkan dalam rajah di bawah.
PALM-H3 direka untuk menjana urutan CDRH3 de novo dalam antibodi. Rantau CDRH3 memainkan peranan paling penting dalam menentukan kekhususan mengikat antibodi untuk urutan antigen tertentu. PALM-H3 ialah model seperti pengubah yang menggunakan model antigen berasaskan ESM2 sebagai pengekod dan Roformer antibodi sebagai penyahkod. Kajian itu juga membina A2binder untuk meramalkan pertalian mengikat antibodi yang dihasilkan secara buatan.
Pembinaan PALM-H3 dan A2binder merangkumi tiga langkah: Pertama, para penyelidik telah melatih dua model Roformer masing-masing pada rantai berat antibodi tidak berpasangan dan urutan rantai ringan. Kemudian, A2binder dibina berdasarkan ESM2 terlatih, Roformer rantai berat antibodi dan Roformer rantai ringan antibodi, dan dilatih menggunakan data pertalian berpasangan. Akhirnya, PALM-H3 dibina menggunakan ESM2 terlatih dan Roformer rantai berat antibodi dan dilatih pada data antigen-CDRH3 berpasangan untuk menjana CDRH3 de novo.
Prestasi A2binder dinilai dengan membandingkan keupayaannya untuk meramalkan pertalian dengan beberapa kaedah asas.
A2binder berfungsi dengan baik pada set data perkaitan, sebahagiannya disebabkan oleh pra-latihan pada jujukan antibodi, yang membolehkan A2binder mempelajari corak unik yang terdapat dalam jujukan ini.
Die Ergebnisse zeigen, dass A2binder bei allen Antigen-Antikörper-Affinitätsvorhersagedatensätzen eine bessere Leistung erbringt als das Basismodell ESM-F (letzteres hat das gleiche Framework, aber das vorab trainierte Modell). ist die ESM2-Substitution), was darauf hindeutet, dass das Vortraining mit Antikörpersequenzen für verwandte nachgelagerte Aufgaben von Vorteil sein könnte.
Um die Leistung des Modells bei der Vorhersage von Affinitätswerten zu bewerten, verwendeten die Forscher auch zwei Datensätze, 14H und 14L, die Affinitätswertbezeichnungen enthalten.
A2binder übertrifft alle Basismodelle sowohl hinsichtlich der Pearson-Korrelations- als auch der Spearman-Korrelationsmetriken. A2binder erreicht eine Pearson-Korrelation von 0,642 für den 14H-Datensatz (eine Verbesserung von 3 %) und 0,683 für den 14L-Datensatz (eine Verbesserung von 1 %).
Allerdings sank die Leistung von A2binder und anderen Basismodellen bei den 14H- und 14L-Datensätzen im Vergleich zu anderen Datensätzen leicht. Diese Beobachtung steht im Einklang mit früheren Studien.
Die Forscher untersuchten den Unterschied zwischen den von PALM-H3 produzierten und natürlichen Antikörpern Antikörper. Unterschied zwischen. Es wurde festgestellt, dass sich ihre Sequenzen erheblich unterscheiden, die Bindungswahrscheinlichkeiten der produzierten Antikörper wurden jedoch durch diese Unterschiede nicht wesentlich beeinflusst. Gleichzeitig führen ihre strukturellen Unterschiede zu einer Verringerung der Bindungsaffinität. Diese Ergebnisse stehen im Einklang mit früheren Studien zur Netzwerkanalyse von Antikörperbibliotheken und zur Erzeugung funktioneller Proteinsequenzen.
Insgesamt zeigen die Ergebnisse, dass PALM-H3 im Gegensatz zu natürlichen Antikörpern in der Lage ist, eine Vielzahl von Antikörpersequenzen mit hohen Bindungsaffinitäten zu erzeugen.
Darüber hinaus überprüften die Forscher die Leistung von PALM-H3 durch ClusPro und SnugDock. PALM-H3 ist in der Lage, Antikörper gegen ein stabilisierendes Peptid in der HR2-Region von SARS-CoV-2, der CDRH3-Sequenz, zu erzeugen. Es wurde eine neuartige CDRH3-Sequenz generiert und bestätigt, dass die generierte Sequenz GRREAAWALA im Vergleich zur nativen CDHR3-Sequenz GKAAGTFDS ein verbessertes Targeting von Antigen-stabilisierenden Peptiden aufweist.
Darüber hinaus ist PALM-H3 in der Lage, Antikörper mit höherer Affinität gegen die neu auftretende CDRH3-Sequenz der SARS-CoV-2-Variante XBB zu erzeugen. Die resultierende Sequenz AKDSRTSPLRLDYS hat eine stärkere Affinität zu XBB als ihre Quelle ASEVLDNLRDGYNF.
Darüber hinaus überwindet PALM-H3 nicht nur die lokalen optimalen Fallstricke traditioneller sequentieller Mutationsstrategien, sondern erzeugt im Vergleich zum E-EVO-Ansatz auch Antikörper mit höherer Antigenbindungsaffinität. Dies unterstreicht die Vorteile von PALM-H3 beim Antikörperdesign, das eine effizientere Erkundung des Sequenzraums und die Erzeugung hochaffiner Binder ermöglicht, die auf spezifische Epitope abzielen.
Darüber hinaus führten die Forscher auch In-vitro-Experimente durch, darunter Western Blot, Oberflächenplasmonresonanzanalyse und Pseudovirus-Neutralisierung Das Experiment lieferte einen wichtigen Nachweis für die Wirksamkeit des von PALM-H3 entwickelten Antikörpers.
PALM-H3 Zwei Antikörper, die gegen die Spike-Proteine der SARS-CoV-2-Wildtyp-, Alpha-, Delta- und neutralisierende Wirkung von Antikörpern. Die robusten empirischen Ergebnisse dieser Nasslaborexperimente ergänzen rechnerische Vorhersagen und Analysen und bestätigen die Fähigkeit von PALM-H3 und A2binder, wirksame Antikörper mit hoher Spezifität und Affinität für bekannte und neue Antigene zu erzeugen und auszuwählen.
Zusammenfassend lässt sich sagen, dass das vorgeschlagene PALM-H3 die Fähigkeit eines groß angelegten Antikörper-Vortrainings und die Wirksamkeit der globalen Merkmalsfusion integriert, was zu einer hervorragenden Affinitätsvorhersageleistung und der Fähigkeit zur Entwicklung hochaffiner Antikörper führt . Darüber hinaus machen die direkte Sequenzgenerierung und die interpretierbare Gewichtsvisualisierung es zu einem effizienten und interpretierbaren Werkzeug für die Entwicklung hochaffiner Antikörper.
Atas ialah kandungan terperinci Mereka bentuk antibodi dari awal, pasukan Tencent dan Universiti Peking telah melatih model bahasa besar dan menerbitkannya dalam sub-jurnal Nature. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!