Heim > Artikel > Technologie-Peripheriegeräte > Als neue Methode der Glykoproteomik entwickelte Fudan ein hybrides End-to-End-Framework auf Basis von Transformer und GNN, veröffentlicht im Nature-Unterjournal
Die Proteinglykosylierung ist eine posttranslationale Modifikation von Proteinen durch Zuckergruppen, die eine wichtige Rolle bei verschiedenen physiologischen und pathologischen Funktionen von Zellen spielt.
Glykoproteomik ist die Untersuchung der Proteinglykosylierung innerhalb des Proteoms, wobei Flüssigkeitschromatographie in Verbindung mit Tandem-Massenspektrometrie (MS/MS)-Technologie verwendet wird, um kombinierte Informationen über Glykosylierungsstellen, Glykosylierungsniveaus und Zuckerstrukturen zu erhalten.
Allerdings haben aktuelle Datenbanksuchmethoden für die Glykoproteomik aufgrund des begrenzten Vorkommens strukturbestimmender Ionen häufig Schwierigkeiten bei der Bestimmung von Glykanstrukturen. Obwohl spektrale Suchmethoden die Fragmentierungsintensität nutzen können, um die strukturelle Identifizierung von Glykopeptiden zu erleichtern, behindern Schwierigkeiten beim Aufbau von Spektralbibliotheken ihre Anwendung.
In der neuesten Studie schlugen Forscher der Fudan-Universität DeepGP vor, ein hybrides Deep-Learning-Framework, das auf Transformer- und graphischen neuronalen Netzen basiert, zur Vorhersage von MS/MS-Spektren und Retentionszeiten (RT) von Glykopeptiden.
Zwei graphische neuronale Netzwerkmodule werden verwendet, um verzweigte Zuckerstrukturen zu erfassen und jeweils Zuckerionenstärken vorherzusagen. Darüber hinaus wurde eine Pre-Training-Strategie implementiert, um den Mangel an glykoproteomischen Daten zu beheben.
Diese Studie trägt den Titel „Deep Learning Prediction of Glycopeptide Tandem Mass Spectra Powers Glycoproteomics“ und wurde am 30. Juli 2024 in „Nature Machine Intelligence“ veröffentlicht.
Posttranslationale Proteinmodifikationen (PTMs) erhöhen die Komplexität des Proteoms erheblich. Als eines der wichtigsten PTMs betrifft die Glykosylierung mehr als 50 % der Säugetierproteine und spielt eine Schlüsselrolle bei vielen physiologischen und pathologischen Prozessen.Während des Glykosylierungsprozesses werden Zuckermoleküle an die Seitenketten bestimmter Aminosäurereste gebunden, was zu struktureller Heterogenität führt, was zu einer Diversität der Glykopeptid-Isomere führt und die Schwierigkeit der Identifizierung erhöht.
Flüssigkeitschromatographie-Tandem-Massenspektrometrie (LC-MS/MS) ist die primäre Technik zur Identifizierung von Glykopeptiden anhand von Fragmentionen und Molekulargewicht in Kombination mit RT. Das Masse-Ladungs-Verhältnis (m/z) allein reicht nicht aus, um die Zuckerstruktur zu bestimmen. Daher verwenden Wissenschaftler spektrale Matching-Methoden, um die Identifizierungsempfindlichkeit zu verbessern. Der Aufbau von Glycopeptid-MS/MS-Spektralbibliotheken ist jedoch kostspielig und komplex.
In den letzten Jahren hat Deep Learning Fortschritte bei der Vorhersage des Peptid-MS/MS-Spektrums gemacht. Allerdings schränkt die relativ geringe Anzahl aktueller Glycopeptidomics-Datensätze und das Fehlen standardisierter Protokolle zur Generierung von Glycopeptid-Massenspektrometriedaten die Verfügbarkeit geeigneter Daten für das Deep-Learning-Modelltraining ein.
Zu diesem Zweck schlagen Forscher der Fudan-Universität DeepGP vor, ein auf Deep Learning basierendes hybrides End-to-End-Framework für vollständige N-Glykopeptid-MS/MS-Spektren und RT-Vorhersage. Das Deep-Learning-Framework besteht aus einem vorab trainierten Transformer-Modul und zwei Graph Neural Network (GNN)-Modulen.
Abbildung: Modellarchitektur und Glykopeptid-MS/MS-Spektralvorhersage. Das DeepGP-Modell akzeptiert Glykopeptide als Eingabe. Vorläuferladungszustand
Strategie vor dem Training, um den Mangel an Glykoproteomikdaten zu lindern
Die Forscher demonstrierten die hohe Genauigkeit von DeepGP bei MS/MS- und RT-Vorhersagen anhand von Maus- und menschlichen Probendatensätzen.
Abbildung: DeepGP kombiniert mit pGlyco3 (einer Glykopeptid-Suchmethode) zur Glykopeptid-Identifizierung. (Quelle: Papier)Umfassendes Benchmarking von DeepGP anhand synthetischer und biologischer Datensätze bestätigt seine Wirksamkeit bei der Unterscheidung ähnlicher Glykane. DeepGP verbessert in Kombination mit Datenbanksuchen die Empfindlichkeit der Glykopeptiderkennung.
Link zum Papier:
https://www.nature.com/articles/s42256-024-00875-x
Das obige ist der detaillierte Inhalt vonAls neue Methode der Glykoproteomik entwickelte Fudan ein hybrides End-to-End-Framework auf Basis von Transformer und GNN, veröffentlicht im Nature-Unterjournal. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!