Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  Nicht nur DALL·E! Jetzt können KI-Maler modellieren und Videos erstellen. Ich kann mir nicht einmal vorstellen, was in Zukunft passieren wird.

Nicht nur DALL·E! Jetzt können KI-Maler modellieren und Videos erstellen. Ich kann mir nicht einmal vorstellen, was in Zukunft passieren wird.

PHPz
PHPznach vorne
2023-05-04 13:19:061087Durchsuche

​Kürzlich gab Stability.ai, ein von Emad Mostaque gegründetes und finanziertes Unternehmen, die öffentliche Veröffentlichung von künstlerischen Werken bekannt, die von AI geschaffen wurden.

Man denkt vielleicht, dass dies nur ein weiterer Versuch der KI im Bereich der Kunst ist, aber in Wirklichkeit ist es viel mehr. Es gibt zwei Gründe. Erstens ist Stable Diffusion im Gegensatz zu DALL-E 2 Open Source. Das bedeutet, dass jeder das Backbone nutzen kann, um kostenlos Anwendungen für bestimmte Text-zu-Bild-Erstellungsaufgaben zu erstellen. Darüber hinaus haben die Entwickler von Midjourney eine Funktion implementiert, die es Benutzern ermöglicht, es mit Stable Diffusion zu kombinieren, was zu erstaunlichen Ergebnissen geführt hat.

Nicht nur DALL·E! Jetzt können KI-Maler modellieren und Videos erstellen. Ich kann mir nicht einmal vorstellen, was in Zukunft passieren wird.

Stellen Sie sich einfach vor, was in den nächsten Monaten passieren wird. Zweitens kann Stable Diffusion im Gegensatz zu DALL-E mini und Disco Diffusion erstaunlich realistische und künstlerische Werke schaffen, die OpenAI oder Googles Modellen in nichts nachstehen. Es wird sogar behauptet, es sei die neue SOTA unter den „generativen Suchmaschinen“. (Sofern nicht anders angegeben, wurden alle Bilder in diesem Artikel mit Stable Diffusion erstellt.)

Nicht nur DALL·E! Jetzt können KI-Maler modellieren und Videos erstellen. Ich kann mir nicht einmal vorstellen, was in Zukunft passieren wird.

Stable Diffusion verkörpert die besten Eigenschaften der KI-Kunstwelt: Es ist wohl das beste verfügbare KI-Kunstmodell und es ist Open Source. Das ist einfach unerhört und wird enorme Auswirkungen haben. Noch interessanter ist, dass Nachrichten über diese Dienste Sie möglicherweise über die unerwartetsten Quellen erreichen. Deine Eltern, deine Kinder, dein Partner, deine Freunde oder deine Kollegen. Diese Menschen sind oft Außenseiter des Geschehens auf dem Gebiet der künstlichen Intelligenz und entdecken gerade die neuesten Trends auf diesem Gebiet. Kunst könnte die Art und Weise sein, wie KI endlich an die Tür derjenigen klopft, die blind für die Zukunft sind. Ist das nicht sehr poetisch?

Nicht nur DALL·E! Jetzt können KI-Maler modellieren und Videos erstellen. Ich kann mir nicht einmal vorstellen, was in Zukunft passieren wird.

Nicht nur Open Source DALL·E 2

Stability.ai wurde geboren, um „offene KI-Tools zu entwickeln, die es uns ermöglichen, unser Potenzial auszuschöpfen“. Nicht nur ein Forschungsmodell, das den meisten Menschen nie in die Hände fällt, sondern ein Werkzeug mit realen Anwendungen, das ich und Sie nutzen und erkunden können.

​ Das unterscheidet es von anderen Technologieunternehmen wie OpenAI, das die Geheimnisse seiner besten Systeme (GPT-3 und DALL-E 2) eifersüchtig hütet, oder Google, das nicht einmal vorhat, ein eigenes System zu entwickeln (PaLM , LaMDA, Imagen oder Parti) als private Betaversion veröffentlicht. Diese öffentliche Veröffentlichung von Stability.ai geht über die Weitergabe von Modellgewichten und Code hinaus – was zwar für die Gesundheit von Wissenschaft und Technologie von entscheidender Bedeutung ist, den meisten Menschen aber nicht am Herzen liegt. Und bietet außerdem eine codefreie, gebrauchsfertige Website für diejenigen unter uns, die nicht programmieren möchten oder nicht wissen, wie man programmiert.

Nicht nur DALL·E! Jetzt können KI-Maler modellieren und Videos erstellen. Ich kann mir nicht einmal vorstellen, was in Zukunft passieren wird.

Die Website heißt DreamStudio Lite, ist kostenlos nutzbar und kann bis zu 200 Bilder generieren. Wie DALL-E 2 gibt es ein kostenpflichtiges Abonnementmodell, bei dem Sie 1.000 Bilder für 10 £ erhalten (OpenAI füllt jeden Monat 15 Credits auf, aber um mehr Credits zu erhalten, müssen Sie das 115er-Paket für 15 $ kaufen). Die Kosten für DALL-E betragen 0,03 US-Dollar/Bild, während die Kosten für Stable Diffusion 0,01 £/Bild betragen. Darüber hinaus kann Stable Diffusion über die API im großen Maßstab genutzt werden (die Kosten skalieren linear, sodass Sie 100.000 Generationen für 1.000 £ erhalten können). Zusätzlich zur Bildgenerierung wird Stability.ai in Kürze DreamStudio Pro (Audio/Video) und Enterprise (Studio) vorstellen. Eine weitere Funktion, die DreamStudio möglicherweise bald implementiert, ist die Möglichkeit, Bilder aus anderen Bildern anstelle der üblichen Text-zu-Bild-Einrichtung zu generieren. So:

Nicht nur DALL·E! Jetzt können KI-Maler modellieren und Videos erstellen. Ich kann mir nicht einmal vorstellen, was in Zukunft passieren wird.

Nicht nur DALL·E! Jetzt können KI-Maler modellieren und Videos erstellen. Ich kann mir nicht einmal vorstellen, was in Zukunft passieren wird.

Nicht nur DALL·E! Jetzt können KI-Maler modellieren und Videos erstellen. Ich kann mir nicht einmal vorstellen, was in Zukunft passieren wird.

Auf der Website gibt es auch eine Ressource zum Thema Prompt Engineering, die für Sie hilfreich sein könnte, wenn Sie neu in diesem Bereich sind. Darüber hinaus können Sie im Gegensatz zu DALL-E 2 Parameter steuern, um das Ergebnis zu beeinflussen und mehr Einfluss darauf zu behalten. Stability.ai hat alles getan, um den Zugang zu Modellen zu erleichtern. OpenAI war das erste Unternehmen und musste langsamer vorgehen, um die potenziellen Risiken und Vorurteile des Modells zu bewerten, aber es war nicht nötig, das Modell so lange in der geschlossenen Betaphase zu belassen oder ein Geschäftsmodell zu entwickeln, das die Kreativität einschränkte. Sowohl Midjourney als auch Stable Diffusion haben dies bewiesen.

Nicht nur DALL·E! Jetzt können KI-Maler modellieren und Videos erstellen. Ich kann mir nicht einmal vorstellen, was in Zukunft passieren wird.

Sicherheit + Open Source > Datenschutz und Kontrolle

Open-Source-Technologie hat ihre eigenen Grenzen. Offenheit sollte vor Privatsphäre und strenger Kontrolle stehen, aber nicht vor Sicherheit. Wie das Unternehmen in der Ankündigung erklärt, handelt es sich um „eine Lizenz, die sowohl die kommerzielle als auch die nichtkommerzielle Nutzung ermöglicht“, wobei der Schwerpunkt auf einer offenen und verantwortungsvollen nachgelagerten Nutzung des Modells liegt. Es schreibt außerdem vor, dass abgeleitete Werke mindestens den gleichen benutzerbezogenen Beschränkungen unterliegen müssen.

Nicht nur DALL·E! Jetzt können KI-Maler modellieren und Videos erstellen. Ich kann mir nicht einmal vorstellen, was in Zukunft passieren wird.

Das Open-Source-Modell ist an sich schon ein gutes Modell, aber es ist ebenso wichtig, vernünftige Leitplanken zu schaffen, wenn wir nicht wollen, dass diese Technologie am Ende Menschen schadet oder durch Fehlinformationen noch mehr Arroganz im Internet verbreitet. „Da diese Modelle auf einer breiten Palette von im Internet gesammelten Bild-Text-Paaren trainiert werden, können die Modelle einige soziale Vorurteile reproduzieren und unsichere Inhalte produzieren, sodass offene Strategien zur Eindämmung und öffentliche Diskussion dieser Vorurteile es jedem ermöglichen können, an diesem Gespräch teilzunehmen.“ . Auf jeden Fall Offenheit + Sicherheit > Privatsphäre und Kontrolle.

Die Kraft von Open Source, die Welt zu verändern

Mit einem soliden Fundament aus ethischen Werten und Offenheit verspricht Stable Diffusion, seine Konkurrenten in Bezug auf die Auswirkungen in der realen Welt zu übertreffen.

Wer es herunterladen und auf seinem PC ausführen möchte, sollte wissen, dass es 6,9 GB VRAM benötigt – dies ist für High-End-GPUs der Consumer-Klasse geeignet und damit leichter als der DALL-E 2, aber Für die meisten Benutzer immer noch unerreichbar. Der Rest von Ihnen, wie ich, kann sofort mit der Nutzung von Dream Studio beginnen.

Nicht nur DALL·E! Jetzt können KI-Maler modellieren und Videos erstellen. Ich kann mir nicht einmal vorstellen, was in Zukunft passieren wird.

Stable Diffusion gilt weithin als das beste derzeit verfügbare KI-Kunstmodell und wird die Grundlage für unzählige Anwendungen, Netzwerke und Dienste bilden und die Art und Weise, wie wir Kunst schaffen und mit ihr interagieren, neu definieren. Aber jetzt werden Apps, die speziell für verschiedene Anwendungsfälle entwickelt wurden, von Grund auf so entwickelt, dass jeder sie nutzen kann. Menschen verbessern Kinderzeichnungen, erstellen Collagen mit äußerer Zeichnung + innerer Zeichnung, entwerfen Zeitschriftencover, zeichnen Comics, erstellen verwandelte und animierte Videos, generieren Bilder aus Bildern und vieles mehr. Einige dieser Anwendungen sind bereits in DALL-E und Midjourney möglich, aber Stable Diffusion kann die aktuelle kreative Revolution in die nächste Stufe treiben. Mit den Worten des ehemaligen KI-Direktors von Tesla und Li Feifeis Schüler Andrej Karpathy: „Das künstlerische Schaffen ist in eine neue Ära der Zusammenarbeit zwischen Mensch und KI eingetreten.“ KI-Kunstmodelle wie Stable Diffusion beinhalten eine neue Art von Werkzeug, das sollte sein mit dem neuen Denkrahmen der neuen Realität, in der wir leben, verstanden werden. Wir können nicht einfach Analogien oder Parallelen zu anderen Epochen ziehen und erwarten, die Zukunft genau erklären oder vorhersagen zu können. Manche Dinge werden ähnlich sein, manche nicht. Wir müssen die kommende Zukunft als Neuland betrachten.

Nicht nur DALL·E! Jetzt können KI-Maler modellieren und Videos erstellen. Ich kann mir nicht einmal vorstellen, was in Zukunft passieren wird.

Am Ende geschrieben

Es besteht kein Zweifel daran, dass die öffentliche Veröffentlichung von Stable Diffusion das wichtigste und einflussreichste Ereignis aller Zeiten im Bereich der Kunstmodelle für künstliche Intelligenz ist, und dies ist erst der Anfang. Nicht nur DALL·E! Jetzt können KI-Maler modellieren und Videos erstellen. Ich kann mir nicht einmal vorstellen, was in Zukunft passieren wird.

Emad Mostaque, einer der Autoren, sagte auf Twitter: „Erwarten Sie, dass die Qualität auf breiter Front weiter steigt, da wir schnellere, bessere und spezifischere Modelle veröffentlichen. Nicht nur Bilder, nächsten Monat auch Audio, dann wechseln wir zu 3D und Videos.“ Sprachen, Codes und mehr Training

.

Wir stehen am Rande einer mehrjährigen Revolution in der Art und Weise, wie wir Kunst und Kreativität im Allgemeinen interagieren, verbinden und verstehen. Und das nicht nur im philosophischen, intellektuellen Bereich, sondern als etwas, das mittlerweile jeder teilt und erlebt. Die kreative Welt wird sich für immer verändern und wir müssen offene und respektvolle Gespräche führen, um eine bessere Zukunft für alle zu schaffen. Nur wenn Open-Source-Technologie verantwortungsvoll eingesetzt wird, können wir die Veränderung bewirken, die wir sehen möchten.

Das obige ist der detaillierte Inhalt vonNicht nur DALL·E! Jetzt können KI-Maler modellieren und Videos erstellen. Ich kann mir nicht einmal vorstellen, was in Zukunft passieren wird.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen