Heim >Technologie-Peripheriegeräte >KI >Die 5 besten Open-Source-KI-Bildgeneratoren

Die 5 besten Open-Source-KI-Bildgeneratoren

王林Original: 2024-06-14 20:28:001035Durchsuche

Im Internet sind Dutzende kostenloser und quelloffener KI-Text-zu-Bild-Generatoren verfügbar, die auf bestimmte Arten von Bildern spezialisiert sind. Also haben wir den Stapel durchgesehen und die besten Open-Source-KI-Text-zu-Bild-Generatoren gefunden, die Sie jetzt ausprobieren können.

1 Craiyon

The 5 Best Open-Source AI Image Generators

Craiyon ist einer der am einfachsten zugänglichen Open-Source-KI-Bildgeneratoren. Es basiert auf DALL-E Mini, und während Sie das Github-Repository klonen und das Modell lokal auf Ihrem Computer installieren können, scheint Craiyon diesen Ansatz zugunsten seiner Website aufgegeben zu haben.

Das offizielle Github-Repository wurde seit Juni 2022 nicht mehr aktualisiert, aber das neueste Modell ist weiterhin kostenlos auf der offiziellen Craiyon-Website verfügbar. Es gibt auch keine Android- oder iOS-Apps.

Hinsichtlich der Funktionalität finden Sie alle üblichen Optionen vor, die Sie von einem KI-Bildgenerator erwarten. Sobald Sie Ihre Eingabeaufforderung eingegeben und ein Bild erhalten haben, können Sie die Hochskalierungsfunktion verwenden, um eine Kopie mit höherer Auflösung zu erhalten. Es stehen drei Stile zur Auswahl: Kunst, Foto und Zeichnung. Sie können auch die Option „Keine“ auswählen, wenn Sie möchten, dass das Modell entscheidet.

Darüber hinaus können Sie im „Expertenmodus“ negative Wörter einfügen, wodurch das Modell angewiesen wird, bestimmte Elemente zu meiden. Es gibt auch eine Funktion zur Vorhersage von Eingabeaufforderungen, die ChatGPT verwendet, um Benutzern dabei zu helfen, die bestmöglichen und detailliertesten Eingabeaufforderungen zu verfassen. Schließlich können Ihnen die KI-gestützten Funktionen zum Entfernen des Hintergrunds dabei helfen, Zeit und Aufwand beim Zuschneiden von Hintergründen aus Bildern zu sparen.

Und das ist ungefähr alles, was Craiyon tut. Es handelt sich nicht um das ausgefeilteste Modell zur KI-Bilderzeugung, aber es eignet sich gut als Basismodell, wenn Sie nichts Detailliertes oder Realistisches wünschen.

Die Nutzung des Modells ist kostenlos, Nutzer der kostenlosen Version sind jedoch auf neun kostenlose Bilder gleichzeitig innerhalb einer Minute beschränkt. Sie können die Stufen „Supporter“ oder „Professional“ abonnieren (zum Preis von 5 bzw. 20 US-Dollar pro Monat und jährlicher Abrechnung), um keine Werbung oder Wasserzeichen, eine schnellere Generierung und die Option zu erhalten, Ihre generierten Bilder privat zu halten. Eine benutzerdefinierte Abonnementstufe ermöglicht außerdem benutzerdefinierte Modelle, Integration, dedizierten Support und private Server.

2 Stable Diffusion 1.5

Stable Diffusion ist vielleicht eines der beliebtesten Open-Source-Modelle zur Text-zu-Bild-Generierung. Es versorgt auch andere Modelle mit Strom, darunter die drei unten genannten Bildgeneratoren. Es wurde im Jahr 2022 veröffentlicht und hat seitdem viele Implementierungen erfahren.

Ich erspare Ihnen die allzu technischen Details zur Funktionsweise des Modells (für die Sie sich das offizielle Github-Repository ansehen können), aber das Modell ist selbst für absolute Anfänger einfach zu installieren und funktioniert gut, solange Sie ein haben dedizierte GPU mit mindestens 4 GB Speicher. Sie können auch online auf Stable Diffusion zugreifen, und wir sind für Sie da, wenn Sie Stable Diffusion auf einem Mac ausführen möchten.

Es stehen mehrere Prüfpunkte (betrachten Sie sie als Versionen) zur Verfügung, die für die stabile Diffusion verwendet werden können. Während wir Version 1.5 getestet haben, befindet sich Version 2.1 ebenfalls in der aktiven Entwicklung und ist präziser.

Auch die Ausführung des Modells ist recht einfach. Wir haben es mit der Web-Benutzeroberfläche AUTOMATIC1111 Stable Diffusion getestet und alle Steuerelemente und Parameter funktionieren gut. Dank der LAION-5B-Datenbank, auf der das Modell trainiert hat, ist es auch ziemlich NSFW-sicher (obwohl sie wohlgemerkt nicht perfekt ist). Während die Generierungszeit selbst je nach Hardware variieren kann, können Sie davon ausgehen, dass Ihre Bilder auch bei einfachen Eingabeaufforderungen detailliert und realistisch sind.

3 DreamShaper

DreamShaper ist ein Bilderzeugungsmodell, das auf stabiler Diffusion basiert. Es war als Open-Source-Alternative zu MidJourney gedacht und konzentriert sich auf Fotorealismus in den generierten Bildern, obwohl es mit ein paar Optimierungen genauso gut mit Anime- und Malstilen umgehen kann.

Das Modell ist leistungsfähiger als Stable Diffusion und bietet Benutzern mehr Freiheit bei der endgültigen Ausgabe, die von blitzschnellen Verbesserungen bis hin zu lockereren NSFW-Beschränkungen reicht. Das Ausführen des Modells ist ebenfalls einfach, da eine herunterladbare, vorab trainierte Version online für den lokalen Zugriff verfügbar ist und eine Vielzahl von Websites, darunter Sinkin.ai, RandomSeed und Mage.space (erfordert ein Basisabonnement), mit denen Sie das Modell ausführen können GPU-Beschleunigung.

Wie Sie wahrscheinlich inzwischen erraten können, sehen mit DreamShaper generierte Bilder im Vergleich zu Stable Diffusion tendenziell realistischer aus. Selbst wenn Sie auf beiden Modellen die gleiche Eingabeaufforderung ausführen, wird das DreamShaper-Modell wahrscheinlich realistischer, detaillierter und besser beleuchtet sein.

Dies gilt insbesondere für Porträts oder Charaktere, was meiner Meinung nach im Vergleich zur gleichen Eingabeaufforderung an der stabilen Diffusion mangelt. Wenn Ihre Bilder zu realistisch werden, gibt es vier Möglichkeiten, ein KI-generiertes Bild zu erkennen.

Sie benötigen auch keinen riesigen PC, um das Modell auszuführen. Meine GTX 1650Ti mit 4 GB VRAM lief mit dem Modell einwandfrei. Die Generierungszeit war etwas länger, aber es schien keinen Einfluss auf die tatsächliche Ausgabe zu haben. Allerdings benötigen Sie möglicherweise GPUs mit mehr VRAM, um DreamShaper XL auszuführen, das auf dem Stable Diffusion XL-Modell basiert.

4 InvokeAI

Invoke AI ist ein weiteres KI-basiertes Bildgenerierungsmodell, das auf Stable Diffusion basiert, mit einer XL-Version, die auf Stable Diffusion XL basiert. Es verfügt außerdem über eine eigene Web- und Befehlszeilen-Benutzeroberfläche, sodass Sie sich nicht mit Dingen wie der Stable Diffusion-Web-Benutzeroberfläche herumschlagen müssen.

Das Modell konzentriert sich darauf, Benutzern die Möglichkeit zu geben, auf der Grundlage ihres geistigen Eigentums mit maßgeschneiderten Arbeitsabläufen visuelle Darstellungen zu erstellen. InvokeAI ist eines der besten Open-Source-KI-Bildgenerierungsmodelle zum Trainieren benutzerdefinierter Modelle und zum Arbeiten mit geistigem Eigentum.

Das offizielle Github-Repository listet zwei Installationsmethoden auf: die Installation über das Installationsprogramm von InvokeAI oder die Verwendung von PyPI, wenn Sie mit einem Terminal und Python vertraut sind und mehr Kontrolle über die mit dem Modell installierten Pakete benötigen.

Allerdings bringt die zusätzliche Kontrolle einige Einschränkungen mit sich, vor allem strengere Hardwareanforderungen. InvokeAI empfiehlt eine dedizierte GPU mit mindestens 4 GB Speicher, wobei sechs bis acht GB für die Ausführung der XL-Variante empfohlen werden. Die VRAM-Anforderungen gelten sowohl für AMD- als auch für Nvidia-GPUs. Sie benötigen außerdem mindestens 12 GB RAM und 12 GB freien Speicherplatz für das Modell, seine Abhängigkeiten und Python.

Obwohl die Dokumentation die GPUs der GTX 10-Serie und 16-Serie von Nvidia aufgrund ihres fehlenden Videospeichers nicht empfiehlt, lief das bereitgestellte Installationsprogramm einwandfrei. Ihr Kilometerstand kann zwar variieren, aber wenn Sie eine GPU der unteren Preisklasse verwenden, müssen Sie damit rechnen, dass Sie länger warten müssen, bis Ihre Eingabeaufforderungen in Bilder umgewandelt werden. Schließlich können Sie unter Windows nur eine Nvidia-GPU verwenden, da AMD-GPUs derzeit nicht unterstützt werden.

Bei der Bilderzeugung tendiert das Modell eher zu künstlerischen Stilen als zum Fotorealismus. Natürlich können Sie das Modell anhand Ihres Datensatzes trainieren und Bilder generieren lassen, die Ihren Wünschen näher kommen, auch wenn es sich dabei um fotorealistische Bilder handelt, insbesondere wenn Sie in den Bereichen Produktdesign, Architektur oder Einzelhandelsflächen arbeiten. Beachten Sie jedoch, dass es sich bei InvokeAI in erster Linie um eine Bildgenerierungs-Engine handelt. Das bedeutet, dass Sie wahrscheinlich standardmäßig Ihre eigenen Modelle verwenden müssen, um die besten Ergebnisse zu erzielen (leicht zu finden über den Modellmanager in der Weboberfläche). Das Modell ist der stabilen Diffusion selbst ziemlich ähnlich.

5 Openjourney

Openjourney ist ein kostenloses Open-Source-KI-Bilderzeugungsmodell, das erneut auf Stable Diffusion basiert. Wenn Sie sich fragen, warum das Modell Openjourney heißt, liegt das daran, dass es auf Midjourney-Bildern trainiert wurde und seinen Stil in den von ihm generierten Bildern nachahmen kann.

Mit PromptHero, dem Unternehmen hinter Openjourney, können Sie das Modell zusammen mit anderen Modellen testen, darunter Stable Diffusion (Versionen 1.5 und 2), DreamShaper und Realistic Vision. Wenn Sie sich anmelden, erhalten Sie 25 kostenlose Credits (ein Credit für jedes generierte Bild). Anschließend müssen Sie die Pro-Abonnementstufe abonnieren, die 9 US-Dollar pro Monat kostet und Ihnen jeden Monat Zugriff auf 300 Credits mit anderen exklusiven Funktionen bietet.

Wenn Sie es jedoch lokal und kostenlos ausführen möchten, können Sie die Modelldatei von HuggingFace herunterladen und über die Stable Diffusion-Web-Benutzeroberfläche ausführen. Openjourney ist außerdem das am zweithäufigsten heruntergeladene KI-Bildgenerierungsmodell auf HuggingFace, direkt hinter Stable Diffusion.

Openjourney listet auf seiner Website keine spezifischen Hardwareanforderungen für die lokale Ausführung des Modells auf, Sie können jedoch mit ähnlichen Hardwareanforderungen wie bei Stable Diffusion rechnen. Dies bedeutet eine dedizierte GPU mit 4 GB VRAM, 16 GB RAM und etwa 12 bis 15 GB freiem Speicherplatz auf Ihrem Computer, um das Modell und seine Abhängigkeiten zu speichern.

Von Openjourney generierte Bilder weisen in der Regel ein Gleichgewicht zwischen Fotorealismus und Kunst auf, sofern nicht anders angegeben. Wenn Sie auf der Suche nach einem Allround-Modell sind und das Erscheinungsbild von Midjourney bevorzugen, ohne für das Abonnement bezahlen zu müssen, ist Openjourney eine der besten Optionen.

Das obige ist der detaillierte Inhalt vonDie 5 besten Open-Source-KI-Bildgeneratoren. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme：

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Vorheriger Artikel：Die 6 besten ChatGPT-Erweiterungen für VS CodeNächster Artikel：Die 6 besten ChatGPT-Erweiterungen für VS Code

In Verbindung stehende Artikel

Mehr sehen