Heim >Technologie-Peripheriegeräte >KI >Das aktuelle Prompt-Projekt ähnelt zu sehr der Wahrsagerei, und die Kommunikation mit Kunst-KI gleicht einem Wortspiel

Das aktuelle Prompt-Projekt ähnelt zu sehr der Wahrsagerei, und die Kommunikation mit Kunst-KI gleicht einem Wortspiel

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBnach vorne: 2023-04-11 20:29:231482Durchsuche

Geben Sie „Pac-Man-Spieloberfläche, Pac-Man, Geist, Tinte, Blinzeln, Clyde, Pac-Maze, Pac-Man, Mondrian-Stil, moderne Kunst, Modernismus, Blüte“ in das KI-Maltool Midjourney The ein resultierendes Bild.

Ist die Eingabephrase „promptes Projekt“ nicht interessant?

Wenn Sie eine Textaufforderung in ein KI-Zeichentool (wie DALL-E oder Midtravel) eingeben, damit es ein Bild generiert, oder das KI-Tool, das automatisch Code generiert – Copilot – bitten, eine Software zu schreiben, werden die Ergebnisse angezeigt was sie bekommen, kann man „Es ist ein Kunstwerk“ nennen.

Wir können diesen Prozess „Engineering“ nennen, was sehr präzise und logisch klingt. Aber wenn Sie zur Discord-Plattform gehen und sich die Eingabeaufforderungen ansehen, die die Leute in die Midjourney-App eingegeben haben, sehen Sie etwa Folgendes:

Galaxie, die aus einem Gehirn entsteht, 8k, Oktan-Rendering, mikrodetailliert – Upbeta – Test – kreativ

meine Zähne sind gelb, hallo Welt :: Würdest du mich ein bisschen besser mögen, wenn sie weiß wären wie deine – s 5000 – q 2 – upbeta – v 3

hg Giger Lovecraft Albtraumhaftes Reich, in dem Monster ewig sind Herrschaft des Terrors

Das Chaos hat den einst tapferen Ritter verdorben und ihn in einen mächtigen Bösewicht verwandelt. Hörner brachen aus ihren Köpfen, Flügel und Schwänze wuchsen aus ihren Seiten, Finger und Zehen wuchsen zu Klauen .so verliert das Leben...

Es muss einen richtigen Weg geben, Aufforderungen logisch zu schreiben. Die Realität ist, dass sich das Schreiben oft spurlos anfühlt. Es ist, als würde man versehentlich einen Zauberspruch anwenden. Wenn man die Wörter an der falschen Stelle einfügt, kann es schnell zu Problemen kommen.

Um es lustig auszudrücken: Das Schreiben von Eingabeaufforderungen wirkt wie Menschen, die versuchen, „ein eifriges und verwirrtes Lasttier“ zur Arbeit zu überreden. Wir glauben, dass es versteht, was wir sagen, aber die Art und Weise, wie es kommuniziert, besteht darin, zu schreien und herumzulaufen.

Was verursacht dieses Phänomen?

Man kann sagen, dass dies ein sehr seltsamer Moment in der Geschichte der künstlichen Intelligenz ist. Seit Jahrzehnten steht die künstliche Intelligenz im „Schatten“ des Turing-Tests (nicht immer, aber oft), der besagt, dass sich „intelligente“ KI genauso verhält und kommuniziert wie intelligente Menschen.

Nach Turings Vorstellungen kann beispielsweise eine künstliche Lebensform als intelligent gelten, wenn sie über aktuelle Ereignisse sprechen kann. In den letzten Jahren haben wir diese Erwartung einer klaren, präzisen und natürlichen Sprache auf alltägliche Geräte ausgeweitet: mit Apple Siri und Amazon Alexa sprechen, nach dem Wetter fragen oder einen Timer stellen.

Aber es ist völlig anders als der „Dialog“ der künstlichen Intelligenz, der Kunstwerke hervorbringt.

Wir versuchen, sie dazu zu bringen, etwas zu schaffen . Das heißt, wenn die KI einen Fehler macht, sind die Folgen viel gravierender. Es stört niemanden, wenn ein Online-Chatbot beim Chatten plötzlich offline geht. Es wäre keine große Sache, wenn der Chatbot die NBA nicht in Echtzeit streamen würde.

Aber was ist, wenn wir ein bestimmtes kreatives Bedürfnis haben, das KI befriedigen kann? Was wäre, wenn wir möchten, dass es einen Blogbeitrag mit einem bestimmten Inhalt und Stil schreibt? Wir müssen auf jeden Fall sicherstellen, dass wir richtig mit ihm kommunizieren können.

Das bedeutet, dass wir anfangen müssen, darüber nachzudenken, was KI denkt, oder besser gesagt, wie sie denkt. Wir müssen das weiterentwickeln, was Psychologen die „Theorie des Geistes“ der Maschinen nennen. „Klingt nach Fantasie, oder?“, sagte mir OpenAI-Mitbegründer Andrej Karpathy, als er über Copilot sprach. „Das ist nichts, was man sieht. Es ist nicht wie die menschliche Theorie des Geistes. Es ist wie ein außerirdisches Artefakt, und es ist aus einem massiven Optimierungsprozess hervorgegangen.“ Der Autor sagt nicht, dass diese künstlichen Intelligenzen tatsächlich bewusst, intelligent oder irgendetwas anderes sind.

Sie sind nur sehr subtile Mustererkenner und Sequenzvervollständiger, innerlich eher wie ein chaotisches Meer der Mathematik

Da wir ihnen jedoch Befehle mit Worten geben, geraten wir in eine seltsame psychologische Beziehung – wir versuchen herauszufinden, was in unserem Inneren vorgeht.

Der Autor wird daran erinnert, wie die alten Griechen mit dem Delphischen Orakel interagierten. Es wurde angenommen, dass das Orakel von Delphi Wissen über die Vergangenheit, Gegenwart und Zukunft besaß. Die Antworten auf Fragen können seltsam sein, denn im Grunde ist es so, als würde man mit einem Ausländer sprechen und wer weiß, welche Ergebnisse man dabei bekommt?

Mit künstlerischer KI zu kommunizieren ist wie ein Wortspiel

Wissenschaftler, die das Innenleben künstlerischer Roboter untersuchen, haben einige ihrer seltsamen Innenleben dokumentiert Maschinenzustand. Kürzlich entdeckten zwei Forscher der University of Texas in Austin, dass DALL-E 2 einen scheinbar verstümmelten Satz erzeugte, der im Modell selbst eine konsistente Bedeutung zu haben schien.

Sie bemerkten, dass das Modell den Ausdruck „Apoploe vesrreitais“ generierte, und als sie ihn als Aufforderung an DALL-E 2 zurückübergaben, zog es Vögel an. Ebenso wird der Empfang von „Contarra ccetnxniams luryca tanniounons“ ein Insekt oder einen Schädling anlocken. Verwenden Sie „Wa ch zod ahakes rea“, um Bilder von Meeresfrüchten zu erstellen.

Warum ist das so? Wie hat das Modell diese seltsame neue interne Sprache generiert? Wissenschaftler wissen nichts darüber, obwohl es sich offenbar um ein gegnerisches Artefakt des Textkodierers von DALL-E 2 handelt.

In ähnlicher Weise sagen Prompt-Writing-Experten, dass das ständige Wiederholen von Phrasen eine Fähigkeit ist, wie Michael Taylor in Prompt Engineering: From Words to Art schreibt.

Link: https://www.saxifrage.xyz/post/prompt-engineering
# 🎜🎜#
DALL-E 2. Midtravel oder andere KI-Kunstwerkzeuge müssen beim Generieren von Bildern wirklich wichtige Merkmale erfassen, wobei einfache Wiederholungen überraschend gut funktionieren. Nehmen Sie diese Aufforderungen als Beispiel: „Homer Simpson, von den Simpsons, isst einen Donut, Homer Simpson, Homer Simpson, Homer Simpson“

Es fühlt sich an wie wir Wir brauchen Hypnose und künstliche Intelligenz, um uns auf Themen zu konzentrieren, die uns am Herzen liegen. Sie können dies auch an der großen Anzahl beschreibender Wörter erkennen, die Verfasser von Aufforderungen normalerweise verwenden. Schauen Sie sich das von Xe Iaso in Kombination mit stabiler Diffusion erzeugte Bild an:

Ich muss sagen, dass das Bild immer noch etwas poetisch ist. Die Kommunikation mit der Kunst-KI fühlt sich an wie ein Wortspiel – wie das Spielen von Scharaden oder Tabus, man muss die KI auslösen, um die richtigen Ergebnisse zu erzielen, indem man ein Gespräch rund um ein Thema führt. Darüber hinaus besteht das Ziel darin, die richtige Beschwörung zu finden, um die Geister, die diesen Altar der Mittler bevölkern, zu erwecken und sie aufzufordern, Ihren Befehlen zu gehorchen. Wie Xe sagte: „Ich bin mir nicht sicher, warum Leute Prompt „Projekt“ nennen. Ich persönlich nenne es lieber „Wahrsagerei“.“# 🎜🎜#
Vielleicht müssen wir einige strenge Klarstellungen zum Prompt-Generierungsmodell vornehmen. Da es von uns eine völlig verrückte Kommunikation erfordert, wird es die Anforderungen des Turing-Tests wahrscheinlich nicht erfüllen und ist intellektuell nicht „wie“ wir. Der Autor ist fest davon überzeugt, dass künstlerische KI eines Tages so sein wird wie wir! Aber jetzt sind sie wirklich sehr, sehr seltsam.

Das obige ist der detaillierte Inhalt vonDas aktuelle Prompt-Projekt ähnelt zu sehr der Wahrsagerei, und die Kommunikation mit Kunst-KI gleicht einem Wortspiel. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme：

Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen

Vorheriger Artikel：Eine kurze Analyse der neuesten technischen Wege für visuelles autonomes FahrenNächster Artikel：Eine kurze Analyse der neuesten technischen Wege für visuelles autonomes Fahren

In Verbindung stehende Artikel

Mehr sehen