Heim > Artikel > Hardware-Tutorial > Magisch modifiziertes „Black Myth: Wukong “, um Midjourney zu besiegen. Dieses KI-Zeichenwerkzeug ist erstaunlich.
Wenn KI-texterzeugende Bilder um Realismus und Kunstfertigkeit konkurrieren, hat Ideogram einen kniffligen Weg eröffnet: Text auf Bildern präzise zu generieren und die Schriftarten und Layouts sind wunderschön.
Diese Anforderung ist keine Nische. Sie kann Poster und Illustrationen mit einem Klick erstellen, ohne P-Bilder zu verwenden. Sie kann viel Ärger ersparen und ist sehr gut für normale Leute geeignet, die nichts über Design wissen.
Wir haben bereits über Version 1.0 von Ideogram geschrieben. Am 21. August kam Version 2.0. Der Realismus ist besser, die Poster sind besser gestaltet und auch die besondere Textkompetenz ist stärker.
Sie haben vielleicht noch nie davon gehört. Dies ist ein KI-Produkt, das von ehemaligen Google-Mitarbeitern entwickelt wurde. Es weist viele Mängel auf, aber das Longboard kann Midjourney in Kurven „überholen“.
Wegweiser https://ideogram.ai/
KI möchte wissen, von welchem Wukong Sie sprechen.
Ideogram verfügt über eine besonders anfängerfreundliche Funktion: „Magic Tips“.
Sie geben das chinesische Aufforderungswort direkt ein. Es hilft Ihnen, es ins Englische zu übersetzen und gleichzeitig zu optimieren. Als Überseeprodukt kann diese Art von Operation die Herzen der Menschen erobern.
Gleichzeitig konzentriert sich Ideogram auf fünf Stile: gewöhnlich, realistisch, Design, 3D und Animation. Sie sind alle leicht zu verstehen, sodass die Auswahl nicht verwirrend ist.
Zunächst möchte ich Ihnen ein einfaches chinesisches Aufforderungswort geben: „Sun Wukong hält einen goldenen Reifen“ im Anime-Stil. Lassen Sie mich von der KI bei der Übersetzung und Optimierung helfen und sehen Sie, wie es frei verwendet werden kann.
Als Shui Linglings „Dragon Ball“-Version von Wukong herauskam, war ich schockiert. Als ich mir die Eingabeaufforderungen ansah, übersetzte die KI Sun Wukong in „Son Goku“, also ist es nicht überraschend.
Außerdem möchte ich Ideogram fragen, ob es zu offensichtlich ist, Lizenzgebühren zu zahlen.
Um weitere Missverständnisse durch die KI zu vermeiden, habe ich bei der Eingabe des Aufforderungsworts aufgehört, faul zu sein, und betont, dass „Sun Wukong“ „Sun Wukong“ und nicht „Son Goku“ ist.
Diesmal haben wir einen realistischeren Stil gewählt und eine detailliertere Szene geschaffen. Der große Weise trägt eine Rüstung und hält einen goldenen Reifen in der Hand. Er steht warm vor der buddhistischen Höhle Orangeton, am unteren Rand des Bildes steht „Black Myth: Wukong“ (Schwarzer Mythos: Wukong).
Es gibt keine Fehler im Text, die Großbuchstaben haben eine starke Wirkung und es entsteht auch die Atmosphäre der buddhistischen Höhle. Allerdings ist das Temperament des „Großen Weisen“ etwas abweichend, das Bild schon ein bisschen atavistisch, und in seinen Augen ist kein Licht.
Bei der einmaligen Verwendung des gleichen Eingabeaufforderungsworts zur Generierung von Midjourney weist der Text Fehler und keinen Sinn für Design auf, aber das etwas hübschere „Monkey King“ und der Stil des Webspiels machen das wieder wett.
▲ Midjourney-Generation
Da ich nicht nachgeben wollte, versuchte ich es noch einmal mit dem 3D-Stil. Das Eingabeaufforderungswort blieb im Wesentlichen dasselbe, aber der Text unten wurde in „Das Spiel wird am 20. August veröffentlicht“ geändert.
Daher ist das von Ideogram generierte Ergebnis dem Werbebild einer bestimmten Q-Version der Blindbox-Serie im chinesischen Stil sehr ähnlich. Das Bild ist sehr sauber, entspricht aber meiner Meinung nach nicht dem 3D-Spielstil Auch der Affenkönig ist von Erlang Shens Aussehen geprägt.
Und auch die KI hat sich dadurch entlarvt, obwohl sie gut in der Darstellung von englischen Texten ist. Dieser Fehler blieb von 1.0 bis 2.0 bestehen.
Es scheint, dass ausländische Produkte die inländische traditionelle Kultur nicht ausreichend verstehen. Die Leistung von Ideogram in der ersten Runde war etwas enttäuschend, aber auch interessant.
Das Ideogram-Team hat gesagt, dass Version 2.0 Flux und DallE in nichts nachsteht. Kürzlich täuschten die von Flux‘ echter Version von LoRA generierten TED-Sprachfotos viele Internetnutzer, da schwer zu erkennen war, ob sie echt oder gefälscht waren. Dann testen wir, wie sehr die von Ideogram generierten Ergebnisse wie Fotos aussehen.
▲ Flusserzeugung
Nachdem ich den realistischen Stil ausgewählt hatte, gab ich die chinesischen Eingabeaufforderungswörter und TED-Sprachfotos ein und der Folientitel lautete „Ideogram 2.0 Release“. Es gibt drei wichtige Punkte: „Genauer Text“. „Gut im Design“ und „Realer“, die Sprecherin steht vor einem Whiteboard, im Hintergrund mehrere Personen.
Es ist ersichtlich, dass das semantische Verständnis von Ideogram gut ist und alle notwendigen Elemente vorhanden sind. Das TED-Logo ist fast gefälscht, die Gesichtsausdrücke des Sprechers und des Publikums sind sehr lebendig und die Haare und die Haut sind sehr lebendig relativ natürlich.
Allerdings werden die Details nicht gut genug behandelt, obwohl es kein Problem mit dem Text gibt, der generiert werden muss, aber einige kleine Wörter, die zufällig auftauchen, verderben den Pot und die Finger und der Körper der Charaktere sind nicht ganz richtig. aber es ist bereits viel besser als die vorherige Version 1.0.
Was das Plakatdesign betrifft, kann man sagen, dass Ideogram die „Komfortzone“ anderer vinzentinischer KI ist.
Wenn der Kassenschlager „Alien“ als Testfrage herangezogen wird: Kann KI dieses unbeschreibliche Gefühl des Schreckens erzeugen?
Ich habe einen Designstil gewählt, die Elemente des Bildes mit treffenden Worten beschrieben und ausdrücklich erwähnt, dass ich am Ende des Posters einen Satz geschrieben habe: „Minderjährige Zuschauer schauen mit Vorsicht zu.“
Der Gesamteffekt ist ein Hingucker. Es wurde erfolgreich eine lange Textfolge mit nur einem kleinen Fehler generiert, die jedoch nicht realistisch war, eher einem Comic-Stil ähnelte und nicht zum Realfilm passte.
Ich habe mich vom schlechten Sommerfilm „A Dream of Red Mansions“ inspirieren lassen und Ideogram gebeten, ein Poster zu erstellen. Der Hintergrund, die Dekorationen und sogar die Charaktere, die in den Aufforderungswörtern erwähnt wurden, waren alle darin enthalten der prompten Worte ist wirklich gut.
Natürlich ist der Titel des Films korrekt geschrieben, aber die Schriftart scheint dem Herrn der Ringe entlehnt zu sein, es gibt einige Dramen und der Gesamtstil ähnelt eher dem Mulan-Animationsfilm.
Der „Designstil“ von Ideogram ist tendenziell zweidimensional, was ziemlich einzigartig ist, aber umgekehrt schränkt dies auch die Verwendungsszenarien von Postern ein.
Zusammenfassend lässt sich sagen, dass Ideogram ein sehr einzigartiges KI-Grafikprodukt ist. Der Grad des Realismus ist ähnlich wie bei Flux und der künstlerische Sinn unterscheidet sich von Midjourney.
▲ „Regensommer“-Muster
, verfügt aber über eine einzigartige Textgenerierungsebene, die sich besser zum Generieren von Postern, Illustrationen, Anzeigen, Emoticons, T-Shirt-Druck usw. eignet.
Die Ergebnisse der menschlichen Bewertung zeigen, dass Ideogram 2.0 hinsichtlich der schnellen Wortausrichtung, der Gesamtleistung und der Qualität der Textwiedergabe besser ist als Flux Pro und DALL·E 3.
▲ Aber das ist die eigene Aussage von Ideogram Gründung und Veröffentlichung von 2.0 liegen genau ein Jahr auseinander.
Das Gründungsteam besteht aus 7 Personen von Google Brain, der University of California, Berkeley, der Carnegie Mellon University und der University of Toronto, von denen 4 die Autoren des Forschungspapiers „Google Imagen Graph Diffusion Model Imagen“ sind. Zusätzlich zur Veröffentlichung von 2.0 hat Ideogram dieses Mal auch eine iOS-App herausgebracht, die direkt in China heruntergeladen werden kann. Die Android-Version soll später veröffentlicht werden. Von Webseiten bis hin zu mobilen Endgeräten können wir jederzeit und überall Bilder generieren.
▲ Mobile Schnittstelle Ideogram steht derzeit allen Benutzern kostenlos zur Verfügung. Nachdem ich jedoch insgesamt 5 Mal 20 Fotos erstellt habe, wurde ich von Ideogram daran erinnert, dass 10 Punkte aufgebraucht sind komm morgen wieder. (Natürlich generiert der Midjourney nebenan 25 Bilder kostenlos und sieht nicht sehr großartig aus.) Wenn Sie wenig Kontakt zu vinzentinischen Diagrammen haben und eine vinzentinische Diagramm-KI für den Einstieg benötigen, ist Ideogram eine gute Wahl Auswahl. Die Eingabe chinesischer Aufforderungswörter und die Verwendung „magischer Aufforderungen“ zum Übersetzen und Optimieren ist ein Aspekt. Darüber hinaus bietet Ideogram auch viele Optionen, mit denen Sie Bilder erstellen können, die Ihren Vorstellungen näher kommen.Stellen Sie Benutzern eine begrenzte Auswahl an Optionen zum „Klicken“ zur Verfügung, wodurch die Interaktion einfacher wird, als wenn Sie „Eingaben“ in ein leeres Eingabefeld durchführen. Welche Bildproportionen, welchen Stil und welchen Ton Sie auch immer wünschen, mit Ideogram können Sie wählen.
▲ „Mädchen mit Perlenohrring isst McDonald's“ in verschiedenen Farben Wenn Sie nicht wissen, wie man schnelle Wörter schreibt, können Sie sie auch zeichnen und Ideogram uns dabei helfen lassen, Verfall in Magie zu verwandeln.Es tut mir leid für meine schlechten Zeichenfähigkeiten, aber die KI kann die Bedeutung verstehen, die Linien und Farben optimieren und einen Hintergrund hinzufügen, und der Stil verbessert sich plötzlich. Wer ist mit KI nicht der Zauberstift Ma Liang?
Darüber hinaus befinden sich unter dem Eingabefeld der Webversion Werke, die von anderen erstellt wurden. Wenn wir diejenigen treffen, die uns gefallen, können wir die Eingabeaufforderungswörter anzeigen und darauf verweisen. Laut Ideogram haben ihre Nutzer im vergangenen Jahr mehr als eine Milliarde öffentlich sichtbare Bilder generiert.
Wenn Sie ein bestimmtes Objekt generieren möchten, aber nicht wissen, wie man das Eingabeaufforderungswort schreibt, hat Ideogram dieses Mal auch die Funktion zum Durchsuchen der öffentlichen Erstellungsbibliothek mit Text eingeführt, für diese Funktion ist jedoch derzeit eine Mitgliedschaft erforderlich.
▲ Suchergebnisse für „Katze“
Alles in allem ist Ideogram ein sehr gut spielbares Grafikprodukt von Vincent.
Es kann den von Benutzern benötigten Textinhalt genauer generieren und sich an verschiedene Bildstile anpassen. Es verfügt über ein breites Einsatzspektrum.
▲ Ideogramm-Blog
kann gelegentlich emotionalen Wert bringen und Bilder verwenden, um Ehrgeiz auszudrücken, obwohl die Emoticons, die es erzeugt, zu stark auf die Ästhetik des europäischen und amerikanischen Internets ausgerichtet sind.
▲ „Ich möchte „Black Myth: Wukong““-Emoticon-Paket spielen
Die Gesamtqualität von Ideogram ist nicht schlecht, die Textfunktion ist leistungsstark, für Anfänger geeignet, einfach zu bedienen und auch die Interaktion ist gut angenehm. Wenn KI-Tools Kreativität, Komfort und Mehrwert vereinen, ist es leicht, süchtig zu werden.
Eine Welt, die aus einem Guss ist, ist zu langweilig. Es ist auch sehr interessant, Einblick in ein kleines Bedürfnis zu haben und dann die Lösung zur ersten in der Branche zu machen.
Es gibt viele Produkte auf der Welt und mit mehr Zielgruppen können wir uns auf weitere solcher KI-„Desserts“ freuen.
Das obige ist der detaillierte Inhalt vonMagisch modifiziertes „Black Myth: Wukong “, um Midjourney zu besiegen. Dieses KI-Zeichenwerkzeug ist erstaunlich.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!