


Die Anzahl der ControlNet-Sterne übersteigt 10.000! Wird die KI-Malerei im Jahr 2023 verrückt werden?
Vom reitenden Astronauten zur dreidimensionalen Dame scheint die KI-Malerei in weniger als einem Jahr revolutionäre Fortschritte gemacht zu haben.
Dieser „reitende Astronaut“ wird vom vinzentinischen Graphenmodell DALL・E 2 gezeichnet, das im April 2022 von OpenAI eingeführt wurde. Sein Vorgänger, DALL・E, demonstrierte den Menschen im Jahr 2021 die Fähigkeit, Bilder direkt aus Text zu generieren und damit die dimensionale Mauer zwischen natürlicher Sprache und Vision zu durchbrechen. Auf dieser Grundlage geht DALL・2 noch einen Schritt weiter und ermöglicht es Benutzern, das Originalbild zu bearbeiten, beispielsweise durch das Hinzufügen eines Corgi zum Bild. Dieser scheinbar einfache Vorgang spiegelt tatsächlich die Verbesserung der Steuerbarkeit des KI-Malmodells wider.
Das beliebteste Vincent-Diagrammmodell im Jahr 2022 ist jedoch in Bezug auf den Einfluss nicht DALL・E 2, sondern ein anderes Modell mit ähnlichen Funktionen – Stable Diffusion. Wie DALL・E 2 ermöglicht Stable Diffusion den Erstellern auch die Bearbeitung der generierten Bilder, der Vorteil besteht jedoch darin, dass das Modell Open Source ist und auf GPUs der Verbraucherklasse ausgeführt werden kann. Daher erfreute sich Stable Diffusion nach seiner Veröffentlichung im August 2022 schnell großer Beliebtheit und wurde innerhalb weniger Monate zum beliebtesten Vincent-Diagrammmodell.
Forscher von Google und der Boston University haben ein „personalisiertes“ Text-zu-Bild-Diffusionsmodell vorgeschlagen DreamBooth Benutzer müssen nur 3 bis 5 Beispiele + einen Satz bereitstellen Dann KI kann fotorealistische Bilder anpassen.
Darüber hinaus schlug ein Forschungsteam der UC Berkeley auch eine neue Methode vor, um Bilder nach menschlichen Anweisungen zu bearbeiten InstructPix2Pix, dieses Modell kombiniert GPT-3 und Stabile Diffusion. Wenn ein Eingabebild und eine Textbeschreibung vorliegen, die dem Modell mitteilt, was zu tun ist, kann das Modell den Beschreibungsanweisungen folgen, um das Bild zu bearbeiten. Um beispielsweise die Sonnenblumen im Gemälde durch Rosen zu ersetzen, müssen Sie dem Modell nur direkt sagen: „Sonnenblumen durch Rosen ersetzen“.
Mit Beginn des Jahres 2023 hat ein Modell namens ControlNet die Flexibilität dieser Art der Steuerung auf den Höhepunkt gebracht.
Die Kernidee von ControlNet besteht darin, der Textbeschreibung einige zusätzliche Bedingungen hinzuzufügen, um das Diffusionsmodell zu steuern (z. B. stabile Diffusion), wodurch die Pose, Tiefe, Bildstruktur und andere generierte Informationen der Charaktere besser gesteuert werden können Bild.
Die zusätzlichen Bedingungen werden hier in Form eines Bildes eingegeben. Das Modell kann darauf basierend eine Canny-Kantenerkennung, Tiefenerkennung, semantische Segmentierung, Hough-Transformationslinienerkennung, Gesamtverschachtelte Kantenerkennung (HED) und eine menschliche Haltung durchführen Eingabebilderkennung usw. und behalten Sie diese Informationen dann im generierten Bild bei. Mit diesem Modell können wir Strichzeichnungen oder Graffiti direkt in Vollfarbbilder umwandeln, Bilder mit derselben Tiefenstruktur usw. erzeugen und die Generierung von Charakterhänden durch Handschlüsselpunkte optimieren.
Dieses Modell hat im Bereich der KI-Malerei große Wellen geschlagen und die Zahl der GitHub-Stars verwandter Projekte hat 10.000 überschritten.
Projektlink: https://github.com/lllyasviel/ControlNet
Obwohl viele Leute es derzeit nur verwenden, um zweidimensionale und dreidimensionale Damen zu generieren, ist es mehr weit verbreitet Nach und nach wurden auch seine Verwendungsmöglichkeiten entdeckt, beispielsweise für Hausdesign, Fotografie, Film- und Fernsehproduktion, Werbedesign usw. In diesen Szenarien wird ControlNet zusammen mit einigen früheren Tools verwendet, wie z. B. LoRA zur Bewältigung großer Probleme bei der Modellfeinabstimmung, dem Video-zu-Animations-Konvertierungstool EbSynth usw. Der kombinierte Einsatz dieser Tools beschleunigt die Integration von KI-Lackierungsmodellen in den Produktionsprozess.
Gestalten Sie Ihre Innenräume mit Tools wie ControlNet und EbSynth neu. Bildquelle: https://creativetechnologydigest.substack.com/p/controlling-artistic-chaos-with-controlnet (vollständiges Tutorial enthalten)
Mit ControlNet und Houdini Tools 3D-Modelle erstellen. Bildquelle: https://www.reddit.com/r/StableDiffusion/comments/115eax6/im_working_on_api_for_the_a1111_controlnet/
Mit Dreambooth und trolNet ändert die 2D-Bildbeleuchtung, kann für die Postproduktion von Fotos und Videos verwendet werden. Bildquelle: https://www.reddit.com/r/StableDiffusion/comments/1175id9/when_i_say_mindblowing_i_mean_it_new_experiments/ und E bSynth wandelt Animationen in reale Personen um . Obwohl die Ergebnisse noch nicht großartig sind, hat es das Potenzial gezeigt, Anime in Live-Action umzuwandeln, ohne dass Schauspieler auftreten müssen. Bildquelle https://www.reddit.com/r/StableDiffusion/comments/117ewr9/anime_to_live_action_with_controlnet_ebsynth_not/
Das berühmte „neue Logo“ der Marke, erstellt von einem Designer mit ControlNet. Bildquelle: https://twitter.com/fofrAI/status/1628882166900744194
Zusätzlich zu den Überraschungen hat der Fortschritt dieser Technologien auch Praktiker in der Malerei und anderen Bereichen in Angst und Wut gestürzt. Die Sorge ist, dass KI Ihnen den Job wegnehmen könnte. Erfreulicherweise handelt es sich bei vielen der von KI erzeugten Bilder um Plagiate und Nachahmungen aktueller Maler, und die geistigen Eigentumsrechte der Maler wurden verletzt.
Bildquelle: https://www.zhihu.com/question/583294094
Da diese Probleme noch gelöst werden müssen, ist die KI-Malerei zu einem akuten Problem im Kreis der Maler geworden. Viele Menschen glauben, dass jeder die KI-Malerei boykottieren und gemeinsam seine Rechte verteidigen sollte. Als sich daher die Nachricht verbreitete, dass ein bekannter Künstler verdächtigt wurde, KI-Malerei für einen Beitrag zu einem Spielestudio zu nutzen, waren andere Künstler völlig empört.Gleichzeitig waren auch die Gamer verärgert. Da es bei der KI-Malerei derzeit noch einige Einschränkungen gibt, wie z. B. die mangelnde Fähigkeit, Handdetails gut zu verarbeiten (Sie können dies sehen, wenn Sie sich das Mädchen im ersten Bild dieses Artikels genau ansehen), kann es den Anforderungen der Spieler nicht gerecht werden Für exquisite visuelle Effekte, Charaktere mit Persönlichkeit und Kreativität usw. fühlten sich viele Spieler „getäuscht“. Daher kann das oben genannte Spielestudio nur eine Notfallerklärung abgeben, in der es heißt, dass es „keine KI-Malerei in seinen Produkten verwenden wird“.
Aber wie lange wird diese Situation anhalten? Wenn das Niveau der KI-Malerei ein Niveau erreicht, das mit bloßem Auge schwer zu unterscheiden ist, woher wissen Sie dann, ob das Spiel, das Sie spielen, vom Künstler oder der KI oder einem „Team“ aus beiden stammt? Quelle: https://m.weibo.cn/2268335814/4870844515358190 Vielleicht in ein paar In einigen Monaten werden KI-Malwerkzeuge wie Programmierer wie Copilot sein. Es ist für Maler zu einem unverzichtbaren Werkzeug bei ihrer täglichen Arbeit geworden. Natürlich hat dies auch die Messlatte für diese Branche geradezu höher gelegt, genau wie für andere Branchen, in die KI „einmarschiert“ ist. Wie man in einer solchen Welle seine Wettbewerbsfähigkeit aufrechterhalten kann, ist möglicherweise eine Frage, über die jeder nachdenken sollte.
Das obige ist der detaillierte Inhalt vonDie Anzahl der ControlNet-Sterne übersteigt 10.000! Wird die KI-Malerei im Jahr 2023 verrückt werden?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Nutzung der Leistung der Datenvisualisierung mit Microsoft Power BI -Diagrammen In der heutigen datengesteuerten Welt ist es entscheidend, komplexe Informationen effektiv mit nicht-technischem Publikum zu kommunizieren. Die Datenvisualisierung schließt diese Lücke und transformiert Rohdaten i

Expertensysteme: Ein tiefes Eintauchen in die Entscheidungsfunktion der KI Stellen Sie sich vor, Zugang zu Expertenberatung zu irgendetwas, von medizinischen Diagnosen bis hin zur Finanzplanung. Das ist die Kraft von Expertensystemen in der künstlichen Intelligenz. Diese Systeme imitieren den Profi

Zunächst ist es offensichtlich, dass dies schnell passiert. Verschiedene Unternehmen sprechen über die Proportionen ihres Code, die derzeit von KI verfasst wurden, und diese nehmen mit einem schnellen Clip zu. Es gibt bereits viel Arbeitsplatzverschiebung

Die Filmindustrie befindet sich neben allen kreativen Sektoren vom digitalen Marketing bis hin zu sozialen Medien an einer technologischen Kreuzung. Als künstliche Intelligenz beginnt, jeden Aspekt des visuellen Geschichtenerzählens umzugestiegen und die Landschaft der Unterhaltung zu verändern

Der kostenlose KI/ML -Online -Kurs von ISRO: Ein Tor zu Geospatial Technology Innovation Die Indian Space Research Organization (ISRO) bietet durch ihr indisches Institut für Fernerkundung (IIRS) eine fantastische Gelegenheit für Studenten und Fachkräfte

Lokale Suchalgorithmen: Ein umfassender Leitfaden Die Planung eines groß angelegten Ereignisses erfordert eine effiziente Verteilung der Arbeitsbelastung. Wenn herkömmliche Ansätze scheitern, bieten lokale Suchalgorithmen eine leistungsstarke Lösung. In diesem Artikel wird Hill Climbing und Simul untersucht

Die Veröffentlichung umfasst drei verschiedene Modelle, GPT-4.1, GPT-4.1 Mini und GPT-4.1-Nano, die einen Zug zu aufgabenspezifischen Optimierungen innerhalb der Landschaft des Großsprachenmodells signalisieren. Diese Modelle ersetzen nicht sofort benutzergerichtete Schnittstellen wie

Der Chip Giant Nvidia sagte am Montag, es werde zum ersten Mal in den USA die Herstellung von KI -Supercomputern - Maschinen mit der Verarbeitung reichlicher Daten herstellen und komplexe Algorithmen ausführen. Die Ankündigung erfolgt nach Präsident Trump SI


Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

EditPlus chinesische Crack-Version
Geringe Größe, Syntaxhervorhebung, unterstützt keine Code-Eingabeaufforderungsfunktion

mPDF
mPDF ist eine PHP-Bibliothek, die PDF-Dateien aus UTF-8-codiertem HTML generieren kann. Der ursprüngliche Autor, Ian Back, hat mPDF geschrieben, um PDF-Dateien „on the fly“ von seiner Website auszugeben und verschiedene Sprachen zu verarbeiten. Es ist langsamer und erzeugt bei der Verwendung von Unicode-Schriftarten größere Dateien als Originalskripte wie HTML2FPDF, unterstützt aber CSS-Stile usw. und verfügt über viele Verbesserungen. Unterstützt fast alle Sprachen, einschließlich RTL (Arabisch und Hebräisch) und CJK (Chinesisch, Japanisch und Koreanisch). Unterstützt verschachtelte Elemente auf Blockebene (wie P, DIV),

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver Mac
Visuelle Webentwicklungstools