Maison >Périphériques technologiques >IA >Le projet d'invite actuel ressemble trop à de la divination, et communiquer avec l'IA artistique est comme un jeu de mots

Le projet d'invite actuel ressemble trop à de la divination, et communiquer avec l'IA artistique est comme un jeu de mots

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBavant: 2023-04-11 20:29:231481parcourir

Entrez "Interface de jeu Pac-Man, Pac-Man, fantôme, encre, clignotement, Clyde, Pac-Maze, Pac-Man, style Mondrian, art moderne, modernisme, floraison" dans l'outil de peinture AI Midjourney The image résultante.

La phrase d'entrée de « projet rapide » n'est-elle pas intéressante ?

Lorsque vous saisissez une invite de texte dans un outil de dessin d'IA (tel que DALL-E ou Midtravel) pour lui faire générer une image, ou demandez à l'outil d'IA qui génère automatiquement du code - Copilot d'écrire un logiciel, les résultats ils obtiennent peuvent être appelés C'est une œuvre d'art.

Nous pouvons appeler ce processus « ingénierie », ce qui semble très précis et logique. Mais si vous allez sur la plateforme Discord et regardez les invites saisies dans l'application Midjourney, vous verrez quelque chose comme ceci :

galaxie résultant d'un cerveau, 8k, rendu d'octane, micro détaillé — upbeta — test — creative

mes dents sont jaunes, bonjour tout le monde :: m'aimeriez-vous un peu mieux si elles étaient blanches comme les vôtres — s 5000 — q 2 — upbeta — v 3

hg giger lovecraft royaume cauchemardesque où les monstres éternellement règne la terreur

le chaos a corrompu le chevalier autrefois vaillant, le transformant en un puissant méchant. Des cornes ont éclaté de sa tête, des ailes et des queues ont poussé sur ses côtés, les doigts et les orteils se sont transformés en griffes. . c'est ainsi que la vie perd….

Il doit y avoir une manière correcte d'écrire les invites de manière logique. La réalité est que l'écriture semble souvent sans trace C'est comme si vous utilisiez un sortilège accidentellement. Mettre les mots au mauvais endroit peut facilement gâcher les choses.

Pour dire les choses de façon amusante, l'écriture d'invites ressemble à des humains essayant d'amadouer « une bête de somme impatiente et confuse » pour qu'elle fasse un travail. Nous pensons qu'il comprend ce que nous disons, mais il communique en criant et en courant partout.

Quelle est la cause de ce phénomène ?

On peut dire que c'est un moment très étrange dans l'histoire de l'intelligence artificielle. Pendant des décennies, l’intelligence artificielle a progressé dans « l’ombre » du test de Turing (pas toujours, mais souvent), selon lequel l’IA « intelligente » se comporte et communique exactement de la même manière que les humains intelligents.

Selon les idées de Turing, par exemple, si une forme de vie artificielle peut discuter de l’actualité, alors elle peut être considérée comme intelligente. Ces dernières années, nous avons étendu cette attente d'un langage clair, précis et naturel aux appareils du quotidien : parler à Apple Siri et Amazon Alexa, poser des questions sur la météo ou régler une minuterie.

Mais c'est complètement différent du « dialogue » de l'intelligence artificielle qui produit des œuvres d'art. Nous essayons de les amener à créer quelque chose . Cela signifie que si l’IA fait une erreur, les conséquences sont bien plus graves. Personne ne se soucie si un chatbot en ligne se déconnecte soudainement pendant qu'il discute. Ce ne serait pas grave si le chatbot ne diffusait pas la NBA en direct.

Mais que se passe-t-il si nous avons un besoin créatif spécifique que l’IA peut satisfaire ? Et si nous voulons qu’il écrive un article de blog avec un contenu et un style spécifiques ? Nous devons certainement nous assurer que nous pouvons communiquer correctement avec lui.

Cela signifie que nous devons commencer à réfléchir à ce que pense l’IA, ou plutôt à la façon dont elle pense. Nous devons développer davantage ce que les psychologues appellent la « théorie de l’esprit » des machines. « Cela ressemble à de la fantaisie, n'est-ce pas ? » Comme me l'a dit Andrej Karpathy, co-fondateur d'OpenAI, en parlant de Copilot. "Ce n'est pas quelque chose que vous avez l'habitude de voir. Ce n'est pas comme la théorie humaine de l'esprit. C'est comme un artefact extraterrestre, et il est issu d'un processus d'optimisation massif

Andrej Karpathy

." L’auteur ne dit pas que ces intelligences artificielles sont réellement conscientes, intelligentes ou autre. Ils ne sont que des reconnaisseurs de modèles et des compléteurs de séquences très subtils, ressemblant davantage à un océan chaotique de mathématiques.

Cependant, parce que nous leur donnons des ordres en utilisant le langage, cela nous met dans une étrange relation psychologique : essayer de comprendre ce qui se passe à l'intérieur.

L'auteur se souvient de la façon dont les Grecs de l'Antiquité interagissaient avec l'oracle de Delphes. On croyait que l’Oracle de Delphes connaissait le passé, le présent et le futur. Les réponses aux questions peuvent être étranges car, en gros, c'est comme parler à un étranger et qui sait quels résultats vous obtiendrez ?

Communiquer avec l'IA artistique est comme un jeu de mots

Des scientifiques étudiant le fonctionnement interne des robots artistiques ont documenté certains des états internes étranges de ces machines. Récemment, deux chercheurs de l'Université du Texas à Austin ont découvert que DALL-E 2 générait une phrase apparemment tronquée qui semblait avoir une signification cohérente dans le modèle lui-même.

Ils ont remarqué que le modèle générait l'expression "Apoploe vesrreitais" et lorsqu'ils l'ont renvoyée à DALL-E 2 comme invite, il a dessiné des oiseaux. De même, recevoir « Contarra ccetnxniams luryca tanniounons » attirera un insecte ou un ravageur. Utilisez "Wa ch zod ahakes rea" pour créer des images de fruits de mer.

Pourquoi ça ? Comment le modèle a-t-il généré cet étrange nouveau langage interne ? Les scientifiques n'en savent rien, bien qu'il semble s'agir d'un artefact contradictoire de l'encodeur de texte de DALL-E 2.

De même, les experts en écriture rapide disent que répéter des phrases est une compétence, comme l'écrit Michael Taylor dans Prompt Engineering: From Words to Art.

Lien : https://www.saxifrage.xyz/post/prompt-engineering

DALL-E 2. Midtravel ou d'autres outils artistiques d'IA doivent véritablement capturer des fonctionnalités importantes lors de la génération d'images aussi simples. la répétition fonctionne étonnamment bien. Prenons cet ensemble d'invites comme exemple : "Homer Simpson, des Simpsons, mangeant un beignet, Homer Simpson, Homer Simpson, Homer Simpson"

C'est comme si nous devions hypnotiser l'intelligence artificielle pour nous concentrer sur les sujets qui nous tiennent à cœur. à propos de. Vous pouvez également le constater dans le grand nombre de mots descriptifs que les rédacteurs d’invites utilisent généralement. Jetez un œil à l'image générée par Xe Iaso combinée à une diffusion stable :

Je dois dire que l'image est quand même un peu poétique. Communiquer avec Art AI ressemble à un jeu de mots - comme jouer à Charades ou Taboo, vous devez déclencher l'IA pour générer les bons résultats en ayant une conversation autour d'un sujet. Au-delà de cela, le but est de trouver la bonne incantation pour éveiller les esprits résidant dans cet autel d’intermédiaires et les appeler à exécuter vos ordres.

Comme Xe l'a dit : "Je ne sais pas pourquoi les gens appellent prompt 'projet'. Personnellement, je préfère l'appeler 'divination'."

Peut-être que nous devons appeler prompt 'projet'. . Parce qu’il nous oblige à communiquer d’une manière complètement folle, il est peu probable qu’il réponde aux exigences du test de Turing et ne nous « ressemble » pas intellectuellement. L’auteur croit fermement qu’un jour l’IA artistique sera comme nous ! Mais maintenant, ils sont vraiment très bizarres.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration：

Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer

Article précédent：Une brève analyse des dernières voies techniques pour la conduite autonome visuelleArticle suivant：Une brève analyse des dernières voies techniques pour la conduite autonome visuelle

Articles Liés

Voir plus