Heim > Artikel > Technologie-Peripheriegeräte > Mit einer mit AlphaFold vergleichbaren Genauigkeit gleicht die KI-Methode der EPFL Proteininteraktionen aus Sequenzen ab
Proteine sind der Grundstein des Lebens und an fast allen biologischen Prozessen beteiligt. Um die Komplexität der Zellfunktion zu erklären, ist es von entscheidender Bedeutung, zu verstehen, wie Proteine interagieren.
2. Neue Methode: Paarung interagierender Proteinsequenzen
Das Team von Anne-Florence Bitbol an der Ecole Polytechnique Fédérale de Lausanne (EPFL) hat eine Methode zur Paarung interagierender Proteinsequenzen vorgeschlagen. Diese Methode nutzt die Leistungsfähigkeit von Proteinsprachmodellen, die auf mehreren Sequenzausrichtungen trainiert wurden.
3. Vorteile der Methode
Diese Methode eignet sich gut für kleine Datensätze und kann die Strukturvorhersage von Proteinkomplexen durch überwachte Methoden verbessern.
4. Forschungsergebnisse veröffentlicht
Die Forschung trug den Titel „Paarung interagierender Proteinsequenzen mithilfe maskierter Sprachmodellierung“ und wurde am 24. Juni 2024 in „PNAS“ veröffentlicht.
Vorhersage von Protein-Protein-WechselwirkungenProtein-Protein-Wechselwirkungen sind entscheidend für die Zellfunktion, sie gewährleisten die Spezifität der Signalübertragung und die Bildung von Multiproteinkomplexen wie molekularen Motoren oder Rezeptoren. Die Vorhersage von Protein-Protein-Wechselwirkungen und ihrer komplexen Strukturen ist ein wichtiges Thema in der Computerbiologie und Biophysik.
Obwohl Deep-Learning-Methoden wie AlphaFold bei der Vorhersage der Proteinmonomerstruktur erhebliche Fortschritte gemacht haben, ist die Vorhersageleistung komplexer Strukturen immer noch nicht so gut wie die Monomervorhersage, und es besteht Heterogenität. AlphaFold erstellt zunächst ein homologes Multiple Sequence Alignment (MSA) der abgefragten Proteinsequenz, und die Qualität des MSA ist äußerst entscheidend für die Vorhersagegenauigkeit.
Gepaarte MSA von Heteropolymeren
Bei Proteinkomplexen (Heteromultimeren), an denen mehrere Ketten beteiligt sind, kann gepaartes MSA koevolutionäre Informationen zwischen Interaktionspartnern liefern und dabei helfen, auf Kontakte zwischen Ketten zu schließen. Die Konstruktion korrekt gepaarter MSA ist jedoch eine Herausforderung, insbesondere bei Eukaryoten sind viele homologe Proteine und hängen nicht von der genomischen Nähe ab.
Koevolutionsmethode
Genomnähe, ungefähre Homologie, phylogeniebasierte Methoden und Koevolutionsstrategien werden derzeit kombiniert, um diese Herausforderung zu bewältigen, obwohl die Koevolutionsmethode große Datenmengen erfordert befindet sich noch in der Optimierung. Zeigt Potenzial für die Paarung und Vorhersage komplexer Strukturen, insbesondere durch die Zuordnung homologer Proteine durch Maximierung des koevolutionären Signals.
DiffPALM: Eine differenzierbare Paarungsmethode
Anne-Florence Bitbols Team an der EPFL hat eine Methode zur Paarung interagierender Proteinsequenzen entwickelt, die eine auf Multiple Sequence Alignments (MSA) trainierte Proteinsprache nutzt. Die Leistungsfähigkeit von Modellen wie MSA Transformer und Das EvoFormer-Modul von AlphaFold. Dies ermöglicht es, komplexe Wechselwirkungen zwischen Proteinen mit hoher Genauigkeit zu verstehen und vorherzusagen.
Auf dieser Grundlage schlugen die Forscher Differentiable Pairing using Alignment-Based Language Model (DiffPALM) vor, eine differenzierbare Methode zur Vorhersage verwandter Wortübereinstimmungen mithilfe von MLM.
Grafik: DiffPALM-Leistung auf einem kleinen HK-RR MSA. (Quelle: Papier)DiffPALM übertrifft bestehende Koevolutionsmethoden bei einem schwierigen Benchmark flacher MSAs, die aus einem allgegenwärtigen prokaryotischen Proteindatensatz extrahiert wurden, bei weitem. Die Leistung von DiffPALM verbessert sich weiter schnell, wenn bekannte interagierende Paare als Beispiele bereitgestellt werden.
Pairing-Methoden basierend auf Koevolution konzentrieren sich auf die Untersuchung, wie sich Proteinsequenzen im Laufe der Zeit gemeinsam entwickeln, wenn sie eng interagieren – Veränderungen in einem Protein können zu Veränderungen in seinen interagierenden Molekülen führen. Dies ist ein äußerst wichtiges Thema in der Molekular- und Zellbiologie und wird von auf MSA trainierten Proteinsprachmodellen gut erfasst.
Grafik: AFM-Leistung bei verschiedenen Paarungsmethoden. (Quelle: Papier)Das Team wandte dann DiffPALM auf das Homolog-Matching-Puzzle eukaryontischer Proteinkomplexe an. Zu diesem Zweck verwendeten die Forscher gepaarte DiffPALM-Sequenzen als Eingabe für AFM. In den getesteten Komplexen verbesserte der Einsatz von DiffPALM die Strukturvorhersagen aus AFM teilweise deutlich. Darüber hinaus wird eine Leistung erzielt, die mit der orthologbasierten Paarung vergleichbar ist.
Illustration: Auswirkungen positiver Beispiele, MSA-Tiefe und Erweiterung auf ein anderes Paar Proteinfamilien. (Quelle: Papier)Die Anwendungen von DiffPALM liegen im Bereich der grundlegenden Proteinbiologie auf der Hand, doch seine Einsatzmöglichkeiten gehen darüber hinaus, da es das Potenzial hat, ein leistungsstarkes Werkzeug in der medizinischen Forschung und Arzneimittelentwicklung zu werden. Beispielsweise kann die genaue Vorhersage von Proteininteraktionen dabei helfen, Krankheitsmechanismen zu verstehen und gezielte Behandlungen zu entwickeln.
Forscher haben DiffPALM frei verfügbar gemacht und hoffen, dass die breite Akzeptanz durch die wissenschaftliche Gemeinschaft die Computerbiologie weiter vorantreiben und es Forschern ermöglichen wird, die Komplexität von Proteininteraktionen zu erforschen.
DiffPALM kombiniert fortschrittliche Techniken des maschinellen Lernens mit der effizienten Verarbeitung komplexer biologischer Daten und markiert damit einen großen Fortschritt in der Computerbiologie.
Es verbessert nicht nur das Verständnis der Wissenschaftler für Proteininteraktionen, sondern eröffnet auch neue Wege der medizinischen Forschung, die möglicherweise zu Durchbrüchen bei der Behandlung von Krankheiten und der Arzneimittelentwicklung führen.
Link zum Papier:
https://www.pnas.org/doi/10.1073/pnas.2311887121
Verwandte Berichte:
https://phys.org/news/2024-06-ai-based-approach-protein -interaction.html
Das obige ist der detaillierte Inhalt vonMit einer mit AlphaFold vergleichbaren Genauigkeit gleicht die KI-Methode der EPFL Proteininteraktionen aus Sequenzen ab. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!