Heim >Technologie-Peripheriegeräte >KI >Googles künstliche Intelligenz-Technologie „Transframer' kann aus einem Bild kurze Videos erstellen

Googles künstliche Intelligenz-Technologie „Transframer' kann aus einem Bild kurze Videos erstellen

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBnach vorne: 2023-04-21 10:40:081257Durchsuche

Während sich die Technologie weiterentwickelt, finden Forscher immer wieder neue Wege, um künstliche Intelligenz und maschinelle Lernfähigkeiten zu nutzen. Anfang dieser Woche kündigten Google-Wissenschaftler die Entwicklung von Transframer an, einem neuen Framework zum Generieren kurzer Videos aus einer einzigen Bildeingabe. Diese neue Technologie könnte eines Tages traditionelle Rendering-Lösungen verbessern und es Entwicklern ermöglichen, virtuelle Umgebungen basierend auf maschinellen Lernfunktionen zu erstellen.

Der Name (und in gewisser Weise auch das Konzept) dieses neuen Frameworks ist eine Anspielung auf Transformer, ein weiteres KI-basiertes Modell. Transformer wurde ursprünglich im Jahr 2017 eingeführt und ist eine neuartige neuronale Netzwerkarchitektur, die in der Lage ist, Text durch Modellierung und Vergleich anderer Wörter in einem Satz zu generieren. Das Modell wurde inzwischen in Standard-Deep-Learning-Frameworks wie TensorFlow und PyTorch integriert.

Es wird berichtet, dass Transframer Hintergrundbilder mit ähnlichen Attributen in Kombination mit Abfrageanmerkungen verwendet, um kurze Videos zu erstellen. Obwohl in der Rohbildeingabe keine geometrischen Daten bereitgestellt werden, bewegt sich das resultierende Video um das Zielbild herum und visualisiert die genaue Perspektive. Diese neue Technologie nutzt Googles künstliche Intelligenz DeepMind. Die Plattform wurde demonstriert und ihre Funktionalität bestand darin, ein einzelnes Fotohintergrundbild zu analysieren, um wichtige Bilddaten zu erhalten und zusätzliche Bilder zu generieren. Während dieser Analyse bestimmt das System den Bildausschnitt, der wiederum dabei hilft, die Umgebung des Bildes vorherzusagen.

Kontextuelle Bilder werden dann verwendet, um weiter vorherzusagen, wie das Bild aus verschiedenen Blickwinkeln erscheinen wird. Die Vorhersage modelliert die Wahrscheinlichkeit zusätzlicher Bildrahmen basierend auf den Daten, Anmerkungen und anderen Informationen im Kontextrahmen. Dieses Framework stellt einen enormen Fortschritt in der Videotechnologie dar, da es die Möglichkeit bietet, einigermaßen genaue Videos auf der Grundlage sehr begrenzter Datensätze zu erstellen. Die Transframer-Aufgabe zeigt auch vielversprechende Ergebnisse bei anderen videobezogenen Aufgaben und Benchmarks, wie z. B. semantischer Segmentierung, Bildklassifizierung und Vorhersage des optischen Flusses. Googles künstliche Intelligenz-Technologie „Transframer kann aus einem Bild kurze Videos erstellen

könnte potenziell große Auswirkungen auf videobasierte Branchen wie die Spieleentwicklung haben. Aktuelle Spieleentwicklungsumgebungen basieren auf zentralen Rendering-Technologien wie Schattierung, Textur-Mapping, Tiefenschärfe und Raytracing. Technologien wie Transframer haben das Potenzial, Entwicklern einen neuen Entwicklungspfad zu bieten, indem sie künstliche Intelligenz und maschinelles Lernen zum Aufbau ihrer Umgebungen nutzen und gleichzeitig den Zeit-, Ressourcen- und Arbeitsaufwand für deren Erstellung reduzieren.

Das obige ist der detaillierte Inhalt vonGoogles künstliche Intelligenz-Technologie „Transframer' kann aus einem Bild kurze Videos erstellen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme：

Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen

Vorheriger Artikel：Der Europäische Datenschutzausschuss richtet eine ChatGPT-Arbeitsgruppe ein, um allgemeine Richtlinien für die KI-Regulierung zu formulierenNächster Artikel：Der Europäische Datenschutzausschuss richtet eine ChatGPT-Arbeitsgruppe ein, um allgemeine Richtlinien für die KI-Regulierung zu formulieren

In Verbindung stehende Artikel

Mehr sehen