Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  Das Team der Chinesischen Akademie der Wissenschaften erstellt einen einheitlichen Rahmen zur Verbesserung der Vorhersagegenauigkeit enzymkinetischer Parameter

Das Team der Chinesischen Akademie der Wissenschaften erstellt einen einheitlichen Rahmen zur Verbesserung der Vorhersagegenauigkeit enzymkinetischer Parameter

王林
王林nach vorne
2024-01-10 14:50:28734Durchsuche

Das Team der Chinesischen Akademie der Wissenschaften erstellt einen einheitlichen Rahmen zur Verbesserung der Vorhersagegenauigkeit enzymkinetischer Parameter

Herausgeber |. Rettichhaut

Die Vorhersage enzymkinetischer Parameter ist für das Design und die Optimierung von Enzymen in der Biotechnologie und bei industriellen Anwendungen von entscheidender Bedeutung. Die begrenzte Leistung aktueller Vorhersagetools bei verschiedenen Aufgaben schränkt jedoch ihre praktische Anwendung ein.

Forscher der Chinesischen Akademie der Wissenschaften haben kürzlich UniKP vorgeschlagen, ein einheitliches Framework, das auf vorab trainierten Sprachmodellen basiert und zur Vorhersage enzymkinetischer Parameter verwendet werden kann, einschließlich der Enzymumsatzzahl (kcat), der Michaelis-Menten-Konstante (Km) und der katalytischen Effizienz (kcat/Km), diese Parameter werden aus der Proteinsequenz und der Substratstruktur erhalten.

Es wird auch ein zweischichtiges Framework basierend auf UniKP (EF-UniKP) vorgeschlagen, das kcat-Werte unter Berücksichtigung von Umweltfaktoren wie pH-Wert und Temperatur stabil vorhersagen kann. Gleichzeitig untersuchte das Forschungsteam systematisch vier repräsentative Neugewichtungsmethoden, um Vorhersagefehler bei hochwertigen Vorhersageaufgaben erfolgreich zu reduzieren.

Die Studie trägt den Titel „UniKP: ein einheitliches Framework für die Vorhersage enzymkinetischer Parameter“ und wurde am 11. Dezember 2023 in der Zeitschrift „Nature Communications“ veröffentlicht.

Das Team der Chinesischen Akademie der Wissenschaften erstellt einen einheitlichen Rahmen zur Verbesserung der Vorhersagegenauigkeit enzymkinetischer Parameter

Die Untersuchung der katalytischen Effizienz von Enzymen auf bestimmten Substraten ist ein wichtiges Thema in der Biologie und hat tiefgreifende Auswirkungen auf die Enzymevolution, das Stoffwechsel-Engineering und die synthetische Biologie. In-vitro-Experimentaldaten zur Messung von kcat und Km sowie der maximalen Umsatzrate und der Michaelis-Menten-Konstante können als Indikatoren zur Messung der Effizienz von Enzymen bei der Katalyse spezifischer Reaktionen und zum Vergleich der relativen katalytischen Aktivitäten verschiedener Enzyme verwendet werden.

Derzeit beruht die Messung enzymkinetischer Parameter hauptsächlich auf experimentellen Messungen, die zeitaufwändig, kostspielig und arbeitsintensiv sind, was zu einer kleinen Datenbank experimentell gemessener kinetischer Parameterwerte führt. Beispielsweise enthält die Sequenzdatenbank UniProt über 230 Millionen Enzymsequenzen, während die Enzymdatenbanken BRENDA und SABIO-RK Zehntausende experimentell gemessene kcat-Werte enthalten. Die Integration von Uniprot-Identifikatoren in diese Enzymdatenbanken erleichtert die Verbindung zwischen gemessenen Parametern und Proteinsequenzen. Allerdings ist der Umfang dieser Verbindungen im Vergleich zur Anzahl der Enzymsequenzen immer noch viel kleiner, was den Fortschritt bei nachgelagerten Anwendungen wie der gerichteten Evolution und dem Metabolic Engineering begrenzt.

Framework zur Vorhersage enzymkinetischer Parameter

In dieser Studie haben Forscher der Chinesischen Akademie der Wissenschaften ein neues Framework namens UniKP vorgeschlagen, das auf vorab trainierten Sprachmodellen basiert und darauf abzielt, die Genauigkeit der Vorhersage enzymkinetischer Parameter zu verbessern . Zu diesen Parametern gehören kcat, Km und kcat/Km, die anhand der Enzymsequenz und der Substratstruktur vorhergesagt werden können. Die Forscher führten einen umfassenden Vergleich von 16 verschiedenen Modellen für maschinelles Lernen und zwei Deep-Learning-Modellen durch und stellten fest, dass UniKP hinsichtlich der Vorhersagegenauigkeit gut abschneidet. Diese Forschung soll neue Werkzeuge und Methoden für Forschung und Anwendungen im Bereich der Enzymkinetik liefern.

Das Team der Chinesischen Akademie der Wissenschaften erstellt einen einheitlichen Rahmen zur Verbesserung der Vorhersagegenauigkeit enzymkinetischer Parameter

Abbildung: UniKP-Übersicht. (Quelle: Papier)

Im Vergleich zum vorherigen hochmodernen Modell DLKcat zeigt UniKP eine überlegene Leistung bei der kcat-Vorhersageaufgabe mit einem durchschnittlichen Bestimmtheitsmaß von 0,68, was einer Verbesserung von 20 % entspricht. Die Forscher spekulieren, dass das vorab trainierte Modell erheblich zur Leistung von UniKP beiträgt, indem es unbeaufsichtigte Informationen aus der gesamten Datenbank nutzt, um leicht zu erlernende Darstellungen von Enzymsequenzen und Substratstrukturen zu erstellen.

Die Analyse des Modelllernens zeigt, dass Proteininformationen eine dominierende Rolle spielen, möglicherweise aufgrund der Komplexität der Enzymstruktur im Vergleich zur Substratstruktur. Darüber hinaus kann UniKP kleine Unterschiede in den kcat-Werten zwischen Enzymen und ihren Mutanten effektiv erfassen, einschließlich experimentell gemessener Fälle, was für das Enzymdesign und die Enzymmodifikation von entscheidender Bedeutung ist. Der Unterschied zwischen dem R^2 der von UniKP vorhergesagten Werte und dem R^2 der gmean-Methode für Regionen mit hoher und niedriger Identität zeigt die Fähigkeit von UniKP, tiefer miteinander verbundene Informationen zu extrahieren und somit bei diesen Aufgaben gute Ergebnisse zu erzielen.

Zweischichtiges Framework EF-UniKP

Die meisten aktuellen Modelle berücksichtigen keine Umweltfaktoren, was eine wesentliche Einschränkung bei der Simulation realer experimenteller Bedingungen darstellt. Um dieses Problem zu lösen, schlugen die Forscher ein zweischichtiges Framework EF-UniKP vor, das Umweltfaktoren berücksichtigt. Basierend auf zwei neu erstellten Datensätzen mit pH- bzw. Temperaturinformationen zeigt EF-UniKP eine verbesserte Leistung im Vergleich zum ursprünglichen UniKP. Dabei handelt es sich um eine genaue, vom Organismus unabhängige und kontextabhängige kcat-Vorhersage mit hohem Durchsatz. Darüber hinaus besteht das Potenzial, diesen Ansatz auf andere Faktoren wie Co-Substrat und NaCl-Konzentration zu erweitern.

Das Team der Chinesischen Akademie der Wissenschaften erstellt einen einheitlichen Rahmen zur Verbesserung der Vorhersagegenauigkeit enzymkinetischer Parameter

Abbildung: Zweischichtiges Framework unter Berücksichtigung von Umweltfaktoren. (Quelle: Papier)

Allerdings berücksichtigen bestehende Modelle die Wechselwirkung zwischen diesen Faktoren aufgrund fehlender umfassender Daten nicht. Mit der Weiterentwicklung experimenteller Techniken, einschließlich der Automatisierung von Biocast-Laboren und sich ständig weiterentwickelnden Methoden, rechnen Forscher mit einer Zunahme enzymkinetischer Daten. Dieser Zustrom hat nicht nur das Fachgebiet bereichert, sondern auch die Genauigkeit von Vorhersagemodellen verbessert.

Aufgrund des hohen Ungleichgewichts des kcat-Datensatzes, das zu höheren Fehlern bei Vorhersagen hoher kcat-Werte führt, untersuchte das Team systematisch vier repräsentative Neugewichtungsmethoden, um dieses Problem zu lindern. Die Ergebnisse zeigen, dass die Hyperparametereinstellungen jeder Methode entscheidend für die Verbesserung der Vorhersagen hoher kcat-Werte sind.

Das Team bestätigte die starke Allgemeingültigkeit des aktuellen Rahmenwerks sowohl bei der Vorhersage der Michaelis-Konstante (Km) als auch bei der kcat/Km-Vorhersage. UniKP erreicht Spitzenleistungen bei der Vorhersage von Km-Werten und übertrifft, was noch beeindruckender ist, die kombinierten Ergebnisse aktueller Modelle auf dem neuesten Stand der Technik bei der Vorhersage von kcat/Km-Werten. Darüber hinaus validierten die Forscher das UniKP-Framework auf der Grundlage experimentell gemessener kcat/Km-Werte und kcat/Km-Werten, die mithilfe von kcat- und Km-Vorhersagemodellen für den kcat/Km-Datensatz berechnet wurden.

Es ist erwähnenswert, dass die beobachtete Korrelation zwischen den aus UniKP kcat / UniKP Km abgeleiteten Werten und dem experimentellen kcat / Km relativ gering ist (PCC = −0,01). Dieser Unterschied kann auf die unterschiedlichen Datensätze zurückzuführen sein, die bei der Erstellung der jeweiligen Modelle verwendet wurden, und erfordert daher die Entwicklung eines anderen Modells zur Vorhersage der kcat/Km-Werte. Mit dem Aufkommen einheitlicher Datensätze, die kcat- und Km-Werte enthalten, wird in Zukunft erwartet, dass die Rechenausgabe der kcat- und Km-Modelle weitgehend mit der Ausgabe des dedizierten kcat/Km-Modells übereinstimmt.

Konkrete Anwendungen im Enzymabbau und in der Evolution

UniKPs Anwendung im Tyrosin-Ammoniak-Lyase (TAL)-Enzymabbau und in der gerichteten Evolution zeigt sein Potenzial, die Forschung in der synthetischen Biologie und Biochemie zu revolutionieren. Diese Studie zeigt, dass UniKP hochaktive TALs effektiv erkennt und die katalytische Effizienz bestehender TALs schnell verbessert, wobei RgTAL-489T einen kcat/Km-Wert aufweist, der 3,5-mal höher ist als der des Wildtyp-Enzyms.

Darüber hinaus war das abgeleitete Framework EF-UniKP stets in der Lage, hochaktive TAL-Enzyme mit extrem hoher Genauigkeit zu identifizieren, wobei der kcat/Km-Wert von TrTAL aus Tephrocybe rancida 2,6-mal höher war als der des Wildtyp-Enzyms. Die Ergebnisse zeigten, dass die kcat- und kcat/Km-Werte der fünf Sequenzen diejenigen des Wildtyp-Enzyms übertrafen.

Durch die Beschleunigung des Enzymentdeckungs- und -optimierungsprozesses wird UniKP voraussichtlich zu einem leistungsstarken Werkzeug für die Weiterentwicklung der Biokatalyse, der Arzneimittelentwicklung, des Metabolic Engineering und anderer Bereiche, die auf enzymkatalysierten Prozessen basieren.

Einschränkungen und Ausblick

Die aktuelle Version von UniKP weist jedoch noch einige Einschränkungen auf. Während UniKP beispielsweise in der Lage ist, zwischen experimentell gemessenen kcat-Werten eines Enzyms und seinen Varianten zu unterscheiden, sind die vorhergesagten kcat-Werte nicht genau genug. Dies kann auf unzureichende Datensätze im Vergleich zur Anzahl bekannter Proteinsequenzen und Substratstrukturen zurückzuführen sein.

Während die Neugewichtungsmethode die durch den unausgeglichenen kcat-Datensatz verursachte Vorhersageverzerrung bis zu einem gewissen Grad abmildern kann (~6,5 % Verbesserung), können durch synthetische Minority-Oversampling-Techniken und andere Stichprobensynthesemethoden signifikantere Verbesserungen erzielt werden.

Ein zentrales Ziel der synthetischen Biologie ist die Entwicklung digitaler Zellen, die die Art und Weise, wie Wissenschaftler Biologie studieren, revolutionieren werden. Eine wichtige Voraussetzung für diese Studie ist die sorgfältige Bestimmung der enzymatischen Parameter für alle Enzyme innerhalb des Stoffwechselwegs. Künstliche Intelligenz-gestützte Werkzeuge beleuchten diese Herausforderung und bieten eine Hochdurchsatzmethode zur Vorhersage der Enzymkinetik.

Obwohl der Fehler der UniKP-Prädiktoren im Vergleich zu früheren Modellen verringert ist, bleibt die Ungenauigkeit ein erhebliches Hindernis für die Erstellung genauer Stoffwechselmodelle. Durch die Einbeziehung einer zunehmenden Anzahl experimentell ermittelter kcat- und Km-Werte kann die Modellgenauigkeit verbessert werden.

Als nächstes wollen die Forscher modernste Algorithmen wie Transferlernen, Verstärkungslernen und andere Small-Shot-Lernalgorithmen kombinieren, um unausgeglichene Datensätze effektiv zu verarbeiten. Darüber hinaus möchte das Team weitere Anwendungen erforschen, darunter die Evolution von Enzymen und die globale Analyse von Organismen.

Link zum Papier: https://www.nature.com/articles/s41467-023-44113-1

Das obige ist der detaillierte Inhalt vonDas Team der Chinesischen Akademie der Wissenschaften erstellt einen einheitlichen Rahmen zur Verbesserung der Vorhersagegenauigkeit enzymkinetischer Parameter. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:jiqizhixin.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen