Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  Unendliche Möglichkeiten Das generative KI-Modell von NVIDIA beschleunigt die Proteinsynthese

Unendliche Möglichkeiten Das generative KI-Modell von NVIDIA beschleunigt die Proteinsynthese

王林
王林nach vorne
2023-04-13 16:07:03874Durchsuche

In den letzten zwei Jahren hat maschinelles Lernen die Vorhersage der Proteinstruktur revolutioniert. Jetzt hat künstliche Intelligenz eine neue Revolution im Bereich des Proteindesigns ausgelöst.

Seit dem Aufkommen der KI haben sich viele Wissenschaftler dazu entschlossen, sie für die Proteinforschung zu nutzen. Biologen haben herausgefunden, dass mithilfe maschinellen Lernens Proteinmoleküle in Sekundenschnelle erzeugt werden können. Früher konnte diese Zeit mehrere Monate betragen.

Kürzlich nutzte das Start-up Evozyne vorab trainierte KI-Modelle von NVIDIA, um zwei Proteine ​​mit erheblichem Potenzial in den Bereichen Medizin und saubere Energie zu entwickeln. Eines der Proteine ​​wird zur Behandlung einer angeborenen Krankheit verwendet, ein anderes zum Verbrauch von Kohlendioxid, um die globale Erwärmung zu reduzieren.

无限的可能性 NVIDIA生成式AI模型加速合成蛋白质

Auf diese Weise nutzen Wissenschaftler NVIDIA BioNeMo, um groß angelegte Sprachmodelle zu erstellen, die hochwertige Proteine ​​erzeugen können, um die Arzneimittelentwicklung zu beschleunigen und zur Schaffung einer nachhaltigeren Umwelt beizutragen.

Ein neuer Weg zur Beschleunigung der Arzneimittelforschung

Andrew Ferguson, Mitbegründer von Evozyne und Mitautor des Papiers, sagte: „Erfreulich ist, dass die synthetischen Proteine, die dieses KI-Modell in der ersten Runde produziert hat, es sind.“ Genau wie natürlich vorkommende Proteine. Zeigt an, dass das Modell die Designregeln der Natur gelernt hat.“

Evozyne verwendet NVIDIAs ProtT5. ProtT5 ist ein Transformer-Modell, das Teil von NVIDIA BioNeMo ist, einem Software-Framework und Dienst zur Erstellung medizinischer KI-Modelle.

Der Molekularingenieur Ferguson, dessen Forschungsgebiete die Bereiche Chemie und maschinelles Lernen umfassen, sagte: „BioNeMo ist sehr leistungsstark und ermöglicht es uns, ein Modell zu trainieren und es dann zu sehr geringen Kosten zum Ausführen von Arbeitsaufgaben zu verwenden.“ „Generieren Sie Millionen von Sequenzen.“

Dieses Modell ist das Herzstück der Evovyne ProT-VAE-Pipeline. Die ProT-VAE-Pipeline von Evozyne kombiniert das leistungsstarke Transformer-Modell in NVIDIA BioNeMo mit Variational Autoencodern (VAEs).

Er sagte: „Vor ein paar Jahren ist niemandem aufgefallen, dass Proteine ​​mithilfe großer Sprachmodelle in Kombination mit Variations-Autoencodern entworfen werden können.“

Im Gegensatz dazu durchläuft die Methode von Evozyne nur eine Runde. Sie kann die Hälfte oder mehr davon verändern Aminosäuren in einem Protein. Dies entspricht Hunderten von Mutationen.

Evozyne-Datenwissenschaftler Joshua Moller sagte: „Sie beschleunigen das Training, indem sie die Arbeit auf mehrere GPUs ausweiten.

Dadurch verkürzt sich die Zeit zum Trainieren eines großen KI-Modells von Monaten auf eine Woche. So können wir Modelle trainieren, die sonst unmöglich wären.“ zu trainieren, beispielsweise einige mit Milliarden trainierbarer Parameter. „

Revolutionäres KI-Modell

Die traditionelle Protein-Engineering-Designmethode, nämlich die gerichtete Evolution, verwendet einen langsamen, ungeplanten Ansatz, der normalerweise nur die Reihenfolge einiger weniger Aminosäuren gleichzeitig ändert. Maschinelles Lernen hilft dabei, massiv zu studieren Aminosäurekombinationen und identifizieren dann effizient die nützlichsten Sequenzen

BioNeMo ist ein KI-fähiger Cloud-Dienst und ein Framework für die Arzneimittelentwicklung, das auf dem KI-Modell „Biomolecule Transformer“ für das Training und die Bereitstellung groß angelegter Anwendungen basiert vorab trainiertes LLM, native Unterstützung für gängige Dateiformate für Proteine, DNA, RNA und Chemie und bietet auch Unterstützung für SMILES (für molekulare Strukturen) und FASTA (für Aminosäure- und Nukleotidsequenzen) mithilfe des Datenladers

Mit BioNeMo können Wissenschaftler ganz einfach vorab trainierte Modelle, automatische Downloader und Präprozessoren für UniRef50- und ZINC-Datenbanken mit verschiedenen Modellen, Einbettungen und Ausgaben verwenden. Durch das unbeaufsichtigte Vortraining sind auch gekennzeichnete Daten nicht mehr erforderlich, um schnell gelernte Einbettungen zu generieren, die Proteine ​​vorhersagen Struktur, Funktion, Zellstandort, Wasserlöslichkeit und Membranbindung, Speicherbereich und variabler Bereich usw.

Daunter ist MegaMolBART ein mit 1,4 Milliarden Molekülen trainiertes generatives Chemiemodell (SMILES-String), das für a verwendet werden kann Eine Vielzahl chemischer Informatikanwendungen, und BioNeMo bietet ProtT5 und ESM1 sowie andere Transformer-basierte Proteinsprachenmodelle.

BioNeMo bietet auch OpenFold, ein Deep-Learning-Modell zur Vorhersage der 3D-Struktur neuartiger Proteinsequenzen liest Millionen von Proteinen. Dieses Modell nutzt die Technologie, die neuronale Netze verwenden, um Texte zu verstehen, und lernt, wie die Natur Protein-Aminosäuresequenzen konstruiert Im Vergleich zu den ursprünglich in der Natur vorkommenden Proteinen ist es stabiler und kann unter extremen Bedingungen wie Energiemangel oder hoher Temperatur eine seiner Funktionen erfüllen

.

Darüber hinaus können mithilfe künstlicher Intelligenz auch Aminosäuresequenzen passend zum Rückgrat entworfen werden, wodurch die Stabilität bestimmter Proteine ​​wie Enzyme und Antikörper verbessert werden kann. Künstliche Intelligenz spielt eine sehr wichtige Rolle bei der Entwicklung von Proteinen unterschiedlicher Größe und unterschiedlicher Konformation. In Zukunft kann sie auch dazu beitragen, immer mehr nützliche Proteine ​​zu entwickeln, einschließlich neuer biologischer Materialien, die zur Reduzierung der Umweltverschmutzung und zur Verbesserung der Umwelt eingesetzt werden können .

Das obige ist der detaillierte Inhalt vonUnendliche Möglichkeiten Das generative KI-Modell von NVIDIA beschleunigt die Proteinsynthese. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen