Heim > Artikel > Technologie-Peripheriegeräte > Stable Diffusion XL Turbo kann KI-Bilder in „Echtzeit“-Geschwindigkeit erzeugen
Stable Diffusion XL Turbo (SDXL Turbo) erstellt detaillierte Bilder mit atemberaubender Geschwindigkeit, sogar zu Hause.
Am Dienstag veröffentlichte das Unternehmen Stability AI ein Bildsynthesemodell mit künstlicher Intelligenz namens „Stable Diffusion XL Turbo“. Das Modell ist in der Lage, anhand schriftlicher Eingabeaufforderungen schnell Bilder zu generieren. Tatsächlich ist das Modell so schnell, dass das Unternehmen es als „Echtzeit“-Bildgenerator bewirbt, da es auch in der Lage ist, Bilder von Quellen wie Webcams schnell zu konvertieren
Die Hauptinnovation von
SDXL Turbo ist seine Fähigkeit, die Bildausgabe in einem Schritt zu erzeugen, deutlich weniger als die 20–50 Schritte, die beim Vorgänger erforderlich waren. Stabilitäts-KI führt diesen Effizienzsprung auf eine Technik namens Adversarial Diffusion Destillation (ADD) zurück. ADD nutzt die fraktionierte Extraktion, bei der das Modell von vorhandenen Bildsynthesemodellen lernt, und den kontradiktorischen Verlust, der die Fähigkeit des Modells zur Unterscheidung zwischen realen und generierten Bildern verbessert und so die Authentizität der Ausgabe verbessert.
In einem am Dienstag veröffentlichten Forschungspapier, das sich auf die ADD-Technologie konzentriert, beschreibt Stability AI das Innenleben des Modells. Einer der Vorteile von SDXL Turbo ist seine Ähnlichkeit mit generativen kontradiktorischen Netzwerken (GANs), insbesondere bei der Erzeugung einstufiger Bildausgaben.
SDXL Turbos Bilder sind nicht so detailliert wie die, die SDXL bei höheren Auflösungen erzeugt, daher ist es kein vollständiger Ersatz für das Vorgängermodell. Dank seiner erstaunlichen Geschwindigkeit spart es jedoch Zeit
Um es auszuprobieren, haben wir SDXL Turbo nativ auf einer Nvidia RTX 3060 mit Automatic111 ausgeführt (wobei die gleichen Gewichtungen wie bei den SDXL-Gewichten gesenkt wurden) und es erzeugte in etwa 4 Sekunden ein 3-stufiges 1024×1024-Bild im Vergleich zu einem 20-stufigen SDXL-Bild mit ähnlichen Details. Es dauert 26,4 Sekunden. Kleinere Bilder werden viel schneller generiert (weniger als 1 Sekunde für 512 x 768), und natürlich ermöglichen leistungsstärkere Grafikkarten wie eine RTX 3090 oder 4090 auch schnellere Generierungszeiten. Im Gegensatz zum Marketing von Stability haben wir festgestellt, dass SDXL Turbo-Bilder die besten Details bei etwa 3–5 Schritten pro Bild aufweisen.
Die Generierungsgeschwindigkeit vonSDXL Turbo ist sogenannte „Echtzeit“. Laut Stability AI kann das Modell auf einem NVIDIA A100, einem leistungsstarken, auf KI abgestimmten Grafikprozessor, ein 512×512-Bild in 207 ms erzeugen, einschließlich Kodierung, einem einzigen Rauschunterdrückungsschritt und Dekodierung. Wenn Konsistenzprobleme gelöst werden können, könnten solche Geschwindigkeiten zur Echtzeitgenerierung von KI-Videofiltern oder zur experimentellen Generierung von Videospielbildern führen. Konsistenz bedeutet in diesem Fall, dass das gleiche Thema über mehrere Frames oder Generationen hinweg beibehalten wird.
Derzeit wird SDXL Turbo unter einer nichtkommerziellen Forschungslizenz bereitgestellt, wodurch die Nutzung auf persönliche, nichtkommerzielle Zwecke beschränkt ist. Der Schritt hat in der Stable Diffusion-Community bereits einige Kritik hervorgerufen, aber Stability AI sagt, dass er für kommerzielle Anwendungen offen ist und lädt interessierte Parteien ein, sich für weitere Informationen mit uns in Verbindung zu setzen.
Unterdessen steht Stability AI vor internen Managementproblemen, wobei ein Investor kürzlich CEO Emad Mostaque zum Rücktritt drängte. Berichten zufolge hat das Management von Stability AI die Möglichkeit geprüft, das Unternehmen an ein größeres Unternehmen zu verkaufen. Dies hatte jedoch keinen Einfluss auf die Geschwindigkeit, mit der Stability AI neue Produkte auf den Markt bringt. Erst letzte Woche hat das Unternehmen eine Software namens Stable Video Diffusion auf den Markt gebracht, die Standbilder in kurze Videoclips umwandelt
Stability AI hat eine Beta-Demo seiner SDXL Turbo-Funktion auf seiner Bildbearbeitungsplattform Clipdrop bereitgestellt. Sie können auch eine inoffizielle Live-Demo kostenlos auf Hugging Face ausprobieren. Offensichtlich gelten alle üblichen Vorbehalte, einschließlich der mangelnden Herkunft der Trainingsdaten und der Möglichkeit eines Missbrauchs. Trotz dieser unbeantworteten Fragen verlangsamen sich die technologischen Fortschritte in der KI-Bildsynthese sicherlich nicht.
Wenn es deinen Freunden gefällt, folge bitte „Wissen, was es Neues gibt“!
Das obige ist der detaillierte Inhalt vonStable Diffusion XL Turbo kann KI-Bilder in „Echtzeit“-Geschwindigkeit erzeugen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!