Heim >Technologie-Peripheriegeräte >KI >Stanford und Microsoft haben sich zusammengetan, um mithilfe von Diffusionsmodellen Proteinstrukturen zu generieren, die als Open Source verfügbar sind
Proteine sind lebenswichtig und spielen in nahezu jedem biologischen Prozess eine Rolle. Einerseits können sie Signale zwischen Neuronen übertragen, mikroskopisch kleine Eindringlinge identifizieren und Immunreaktionen aktivieren. Andererseits wurden Proteine als therapeutischer Mediator im Rahmen der Behandlung von Krankheiten umfassend untersucht. Durch die Generierung neuer, physikalisch faltbarer Proteinstrukturen wird somit die Tür zu neuen Möglichkeiten geöffnet, zelluläre Wege zur Behandlung von Krankheiten zu nutzen.
In diesem Artikel stellten Forscher der Stanford University, von Microsoft Research und anderen Institutionen, inspiriert vom Proteinfaltungsprozess in vivo, ein Faltungsdiffusionsmodell (Faltungsdiffusion, FoldingDiff) vor, das die natürlichen Faltungsprozesse von Proteinen zum Design von Proteinen widerspiegelt Rückgratstrukturen.
Konkret beschreiben sie die Struktur des Proteinrückgrats als eine kontinuierliche Reihe von Winkeln, um die relativen Orientierungen der einzelnen Aminosäurereste zu erfassen, und die inhärente Verschiebung und Rotationsinvarianz dieser Darstellung ist extrem verringert die Notwendigkeit komplexer äquivarianter Netzwerke.
Diese Studie trainierte ein probabilistisches Modell mit entrauschter Diffusion basierend auf dem Transformer-Rückgrat und zeigte, dass unser Modell bedingungslos äußerst realistische Proteinstrukturen mit Komplexität und Strukturmustern erzeugen kann, die denen nativer Proteine ähneln.
Einige Internetnutzer sagten: Ich frage mich, ob dieses Modell AlphaFold Konkurrenz machen wird.
Wir können Proteine als Ketten von Aminosäureresten variabler Länge verstehen. Es gibt 20 typische Aminosäuren, die das gleiche dreiatomige N-C_α-C-Grundgerüst teilen, jedoch eine andere Seite haben Ketten sind an das C_α-Atom gebunden (normalerweise mit R bezeichnet, siehe Abbildung 1).
Diese Reste fügen sich zu Polymerketten zusammen, die sich zu 3D-Strukturen falten, deren Form maßgeblich die Funktion des Proteins bestimmt. Diese gefalteten Strukturen können anhand von vier Ebenen beschrieben werden:
Das Bild unten zeigt die Ergebnisse eines Experiments. Das Ramachandran-Diagramm der natürlichen Struktur (Abbildung a) enthält drei Regionen, die der LH-α-Helix, der RH-α-Helix und dem β-Faltblatt entsprechen. Alle drei Regionen sind in der hier erzeugten Struktur vollständig wiedergegeben (Abb. 3b). Mit anderen Worten: FoldingDiff ist in der Lage, sekundäre Strukturelemente innerhalb des Proteinrückgrats zu erzeugen. Darüber hinaus zeigen Experimente, dass das FoldingDiff-Modell korrekt lernt, dass RH-α-Helices häufiger vorkommen als LH-α-Helices. Frühere Arbeiten mit äquivarianten Netzwerken konnten nicht zwischen diesen beiden Spiraltypen unterscheiden.
Das Bild unten zeigt das zweidimensionale Histogramm der Sekundärstruktur in der Testhauptkette (4a) und der generierten Hauptkette (4b). Die Ergebnisse zeigen, dass die generierte Struktur die wahre Struktur widerspiegelt des Proteins, mit mehreren Alpha-Helices, mehreren Beta-Faltblättern und einer Mischung aus beiden.
Die Abbildung unten zeigt, dass 111 der 780 generierten Strukturen (14,2 %) mit einem scTM-Score ≥0,5 (Abb. 5a) gestaltbar sind, was höher ist als der von Trippe et al 11,8 %. Wir sehen auch, dass die generierten Hauptketten den Trainingsbeispielen ähnlicher sind und tendenziell besser gestaltbar sind (5b).
Für weitere Informationen lesen Sie bitte das Originalpapier.
Das obige ist der detaillierte Inhalt vonStanford und Microsoft haben sich zusammengetan, um mithilfe von Diffusionsmodellen Proteinstrukturen zu generieren, die als Open Source verfügbar sind. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!