


Runway-Version von Sora veröffentlicht: High-Fidelity, Super-Konsistenz, Gen-3 Alpha schockierte Internetnutzer
Obwohl das generierte Video nur etwa 10 Sekunden lang ist, scheint es in Bezug auf Klarheit, Details, Zeichenkonsistenz usw. mit allen vorhandenen Videogenerierungsmodellen vergleichbar zu sein.
Gerade jetzt hat das KI-Videogenerierungs-Startup Runway ein neues Basismodell für die Videogenerierung, Gen-3 Alpha, auf den Markt gebracht. Das Modell kann hochdetaillierte Videos mit komplexen Szenenwechseln, mehreren Filmstilen und detaillierter Art Direction erstellen.
Runway sagt, dass der Gen-3 Alpha das erste einer Reihe kommender Modelle ist. Serienmodelle werden auf einer neuen Infrastruktur trainiert, die für groß angelegte multimodale Schulungen entwickelt wurde.
Gen-3 Alpha bietet im Vergleich zu Gen-2 erhebliche Verbesserungen in Bezug auf Wiedergabetreue, Konsistenz und Bewegung und macht einen wichtigen Schritt in Richtung Aufbau eines universellen Weltmodells.
Im Blog betonte Runway, dass alle Videos der Demo mit Gen-3 Alpha ohne jegliche Modifikation erstellt wurden.
Viele Internetnutzer sagten, dass Runway uns wieder einmal wirklich schockiert habe: Runway ist zurück!
Pytorch-Leiter Soumith Chintala glaubt, dass ein Teil der Verarbeitungsqualität Sora-Niveau erreicht.
Als nächstes wollen wir uns den Effekt ansehen, der durch das Runway-Video erzeugt wird.
Eingabeaufforderung: Subtile Reflexionen einer Frau am Fenster eines Zuges, der mit Höchstgeschwindigkeit in einer japanischen Stadt fährt. (Eingabeaufforderung: Subtile Reflexionen einer Frau im Fenster eines Zuges, der mit Höchstgeschwindigkeit in einer japanischen Stadt fährt.) Tipps: Ein Astronaut rennt eine Gasse in Rio de Janeiro entlang. (Eingabeaufforderung: Ein Astronaut läuft durch eine Gasse in Rio de Janeiro.)
Wie Sie der Demo entnehmen können, ist das von Runway generierte 10-Sekunden-Video hervorragend in Bezug auf Klarheit, Detailgenauigkeit, Charakterkonsistenz und Wiedergabetreue. Sehr gut gemacht . Lassen Sie die Leute fragen: Wann kann es verwendet werden?
Feinkörnige Timing-Steuerung
Gen-3 Alpha ist für sehr anschauliche, zeitintensive Untertitel trainiert und ermöglicht fantasievolle Szenenübergänge.
Tipps: Nahaufnahme einer Ameise, die aus ihrem Nest kriecht. Die Kamera zoomt heraus und zeigt die Nachbarschaft hinter dem Hügel. (Eingabeaufforderung: Eine extreme Nahaufnahme einer Ameise, die aus ihrem Nest auftaucht. Die Kamera fährt zurück und gibt den Blick auf ein Viertel hinter dem Hügel frei.) Eingabeaufforderung: Eine FPV-Drohne fliegt über eine Burg auf einer Klippe. (Eingabeaufforderung: Eine FPV-Drohne schoss durch eine Burg auf einer Klippe.)
Erzeugen Sie realistischere menschliche Charaktere
Gen-3 Alpha zeichnet sich durch die Erstellung ausdrucksstarker menschlicher Charaktere mit einer Vielzahl von Bewegungen, Gesten und Emotionen aus.
Tipps: Dies ist ein filmisches Weitwinkelporträt eines Mannes, dessen Gesicht von Licht beleuchtet wird. (Eingabeaufforderung: Ein filmisches Großbildporträt eines Mannes, dessen Gesicht vom Schein eines Fernsehers beleuchtet wird.) Eingabeaufforderung: Ein trauriger, kahlköpfiger Mann mittleren Alters wird plötzlich glücklich, weil plötzlich eine Krone aus lockigem Haar und eine Sonnenbrille herunterfallen auf Auf seinem Kopf. (Eingabeaufforderung: Ein trauriger, kahlköpfiger Mann mittleren Alters freut sich, als ihm plötzlich eine Perücke aus lockigem Haar und eine Sonnenbrille auf den Kopf fallen.) Ein Team aus Ingenieuren und Künstlern arbeitete zusammen, um Gen-3 Alpha in die Lage zu versetzen, eine Vielzahl von Kunststilen und filmischer Terminologie zu verstehen und zu interpretieren.
Tipps: Nachts läuft ein riesiges seltsames Wesen vor dem Fenster durch die heruntergekommene Stadt und eine Straßenlaterne ist schwach beleuchtet. (Eingabeaufforderung: Blick aus dem Fenster auf ein riesiges seltsames Wesen, das nachts durch eine heruntergekommene Stadt läuft, eine einzige Straßenlaterne, die die Gegend schwach beleuchtet.)
Eingabeaufforderung: Zeitrafferaufnahme, mit flackernden Lichtern durch den Korridor gehen, ein silberner Stoff Fliegen über den gesamten Flur. (Eingabeaufforderung: Hyperlapse-Aufnahme durch einen Korridor mit blinkenden Lichtern. Ein silberner Stoff fliegt durch den gesamten Korridor.)
BranchenanpassungRunway sagte, dass durch die Anpassung der Modelle der Gen-3-Serie eine stilisiertere Gestaltung erzielt werden könne Kontrolle und konsistentere Charaktere, optimiert für spezifische künstlerische und erzählerische Anforderungen usw.
Tipp: Over-the-Shoulder-Aufnahme einer Frau, die rennt und in der Ferne eine Rakete beobachtet. (Eingabeaufforderung: Über die Schulter geschossene Aufnahme einer Frau, die rennt und in der Ferne eine Rakete beobachtet.)
Eingabeaufforderung: Ein Profilfoto einer Frau, hinter der in der Ferne ein Feuerwerk aufblüht. (Eingabeaufforderung: Eine Seitenansicht einer Frau mit Feuerwerkskörpern, die in der Ferne hinter ihr explodieren.)
Ich glaube, dass es wie bei großen Textmodellen immer mehr Modelle zur Videogenerierung geben wird und wir diese Produkte frei ausprobieren können. Blog-Link: https://runwayml.com/blog/introducing-gen-3-alpha/
Das obige ist der detaillierte Inhalt vonRunway-Version von Sora veröffentlicht: High-Fidelity, Super-Konsistenz, Gen-3 Alpha schockierte Internetnutzer. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

KI rationalisiert die Waldfeuer -Erholung zulässt es Die KI -Software von Australian Tech -Firma Archistar, die maschinelles Lernen und Computer Vision nutzt, automatisiert die Bewertung der Erstellung von Plänen für die Einhaltung lokaler Vorschriften. Diese Vorvalidation signifikant

Estlands digitale Regierung: Ein Modell für die USA? Die USA kämpfen mit bürokratischen Ineffizienzen, aber Estland bietet eine überzeugende Alternative. Diese kleine Nation verfügt über eine fast 100% digitalisierte, bürgerzentrierte Regierung, die von der KI betrieben wird. Das ist nicht

Die Planung einer Hochzeit ist eine monumentale Aufgabe, die selbst die am meisten organisierten Paare oft überwältigt. In diesem Artikel, einem Teil einer laufenden Forbes -Serie zu AIs Auswirkungen (siehe Link hier), wird untersucht, wie generative KI die Hochzeitsplanung revolutionieren kann. Die Hochzeit pl

Unternehmen nutzen zunehmend KI -Agenten für den Umsatz, während die Regierungen sie für verschiedene etablierte Aufgaben nutzen. Verbrauchervertreter heben jedoch die Notwendigkeit hervor, dass Einzelpersonen ihre eigenen KI-Agenten als Verteidigung gegen die oft gezogenen

Google führt diese Verschiebung an. Die Funktion "KI -Übersichten" bietet bereits mehr als eine Milliarde Nutzer und liefert vollständige Antworten, bevor jemand auf einen Link klickt. [^2] Andere Spieler gewinnen ebenfalls schnell an Boden. Chatgpt, Microsoft Copilot und PE

Im Jahr 2022 gründete er Social Engineering Defense Startup Doppel, um genau das zu tun. Und da Cybercriminals immer fortgeschrittenere KI -Modelle zum Turbo -Ladung ihrer Angriffe nutzen, haben die KI -Systeme von Doppel dazu beigetragen, sie im Maßstab zu bekämpfen - schneller und

Voila kann durch die Interaktion mit geeigneten Weltmodellen im Wesentlichen angehoben werden. Reden wir darüber. Diese Analyse eines innovativen KI -Durchbruch

Labor Day 2050. Parks im ganzen Land füllen sich mit Familien, die traditionelle Grillen genießen, während nostalgische Paraden durch die Straßen der Stadt winden. Die Feier hat nun nun eine museumähnliche Qualität-historische Nachstellung als das Gedenken an C


Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

MinGW – Minimalistisches GNU für Windows
Dieses Projekt wird derzeit auf osdn.net/projects/mingw migriert. Sie können uns dort weiterhin folgen. MinGW: Eine native Windows-Portierung der GNU Compiler Collection (GCC), frei verteilbare Importbibliotheken und Header-Dateien zum Erstellen nativer Windows-Anwendungen, einschließlich Erweiterungen der MSVC-Laufzeit zur Unterstützung der C99-Funktionalität. Die gesamte MinGW-Software kann auf 64-Bit-Windows-Plattformen ausgeführt werden.

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

Dreamweaver Mac
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

SublimeText3 Englische Version
Empfohlen: Win-Version, unterstützt Code-Eingabeaufforderungen!
