Maison >Périphériques technologiques >IA >L'IA aide les peintres humains à remporter la première place dans les concours d'art. Quel est son secret ?
Il y a deux ans, lors du concours d'art de la Colorado State Fair, une œuvre intitulée "Space Opera" a remporté la première place.
Ce tableau est majestueux, clair et sombre, et n'est pas sans rappeler le peintre symboliste français Gustave Moreau. Cependant, il n’a pas été dessiné par un humain, mais par un concurrent sans connaissances en dessin, à l’aide d’un outil de dessin IA.
Remontons le temps jusqu’en 2018. À cette époque, un tableau d'IA intitulé "Portrait d'Edmund Bellamy" s'est vendu pour plus de 400 000 $ chez Christie's à New York. Il s’agit de la première œuvre d’intelligence artificielle mise aux enchères, ce qui marque également le début de la reconnaissance des œuvres d’art d’IA par le marché.
De nos jours, la peinture par l'IA est devenue monnaie courante, et les joueurs de l'IA au pays et à l'étranger quittent le terrain les uns après les autres, laissant cette piste en fumée.
Par exemple, les applications étrangères bien connues de génération de photos d'IA Midjourney, Stable Diffusion et DALL-E organisent constamment des combats avec des dieux. Des entreprises nationales telles que Byte, Alibaba et Tencent lancent également de nouveaux produits et fonctionnalités de temps en temps ; alors.
Cependant, il existe diverses applications de peinture IA. Pour les passionnés d'IA, comment obtenir une correspondance image-texte plus forte ? Comment générer des images plus esthétiques ? Comment déployer efficacement le modèle de diagramme de Vincent ?
Le sixième épisode de "AIGC Experience School" parlera de ce sujet.
Le programme vidéo "AIGC Experience Party" est lancé conjointement par Volcano Engine, NVIDIA, ce site Web et CMO CLUB, réunissant de nombreux professionnels du domaine du marketing pour discuter de l'application, de la réflexion et de la pratique de la technologie AIGC.
Dans cet épisode, deux invités seniors de l'industrie analyseront en profondeur les liens techniques derrière les images de texte hautement esthétiques et enseigneront à chacun comment obtenir une correspondance image-texte plus forte.
Heure de diffusion en direct : 6 août 19h00-19h40
Thème de diffusion en direct : L'imagerie fantastique, le lien technique derrière les images vincentiennes de grande beauté
S ixième Ceci L'épisode du programme a invité deux invités importants, à savoir Zhang Liang, expert technique Doubao Wenshengtu, et Zhao Yijia, architecte de solutions NVIDIA.
Les utilisateurs n'ont qu'à saisir quelques mots simples et l'IA peut générer automatiquement des peintures réalistes et délicates. Qu'il s'agisse de la texture délicate de la peinture à l'huile classique, de la libre expression de l'art abstrait moderne ou de la conception artistique profonde de la peinture à l'encre orientale, il peut créer facilement. Il peut non seulement apprendre et imiter les styles de peintres célèbres de l'histoire, mais également créer de nouveaux genres artistiques, offrant aux utilisateurs des expériences créatives et interactives sans précédent.
Aujourd'hui, la peinture IA a évolué pour devenir « sophistiquée », au point même qu'il est difficile de distinguer le vrai du faux.
Par exemple, comme ceci :
ou comme ceci :
C'est précisément grâce à sa créativité unique et à son expérience interactive immersive qu'AI Wenshengtu est devenu le « parfum » pour lequel les grands fabricants d'IA se disputent . gâteau".
Par exemple, Byte a lancé des produits d'IA tels que Jiuying, Xinghui et Jimeng en une seule fois, sans exception, ils incluent tous des capacités Wenshengtu, et derrière ces produits sont indissociables du modèle Doubao Wenshengtu Large de Byte.
Pour le modèle de graphique vincentien, il n'y a rien de plus que trois choses pour gagner la « faveur » des utilisateurs : une correspondance image-texte plus forte, des effets d'image plus beaux et une expérience de génération plus rapide.
Alors, comment le modèle d'image Doubao Wensheng parvient-il à obtenir une correspondance image-texte plus forte pour répondre à l'idée de conception de l'utilisateur ? Comment générer des images plus esthétiques pour offrir une expérience utilisateur plus ultime ? Comment produire des graphiques plus rapidement pour répondre à des interventions de très grande envergure ?
Les réponses à ces questions seront dévoilées dans le sixième numéro de "AIGC Experience Party".
Le 6 août à 19h, venez dans la salle de diffusion en direct pour regarder "Fantasy Imaging, le lien technique derrière les images vincentiennes de grande beauté", scannez le QR code pour accéder directement à la salle de diffusion en direct .
Revue du dernier numéro
Dans la cinquième diffusion en direct de "AIGC Experience Party", Zhang Jianyang, responsable de la sécurité du contenu et du contrôle des risques de Volcano Engine, et He Kun, directeur principal de la communauté des développeurs d'entreprise NVIDIA , a donné une analyse approfondie de l'AIGC dans le domaine du marketing, de l'innovation et des questions de sécurité, et a expliqué comment parvenir à une croissance soutenue et à un développement régulier des activités dans un contexte de changements.
Comme nous le savons tous, la technologie AIGC devient progressivement un outil innovant pour le marketing d'entreprise. Il peut aider les spécialistes du marketing à créer des supports marketing imaginatifs à une vitesse sans précédent. En entrant simplement quelques mots-clés ou mots-clés, des textes marketing, des images et des vidéos marketing attrayantes peuvent être automatiquement générés en peu de temps.
Cependant, comme toute innovation technologique, si l'AIGC améliore la créativité et l'efficacité du marketing, elle pose également de nombreux problèmes de sécurité.
Zhang Jianyang, responsable de la sécurité du contenu et du contrôle des risques chez Volcano Engine, a utilisé des cas réels pour démontrer comment la technologie d'IA de Volcano Engine peut « protéger » les spécialistes du marketing.
Zhang Jianyang a déclaré que l'illusion de grands modèles rend les résultats de sortie non complètement contrôlables, ce qui entraîne divers risques potentiels dans le contenu marketing. Par exemple, la copie marketing créée par la technologie AIGC contient des termes « absolus » tels que « meilleur », « premier », « de classe mondiale », « premier sur l'ensemble du réseau », etc., et les images ou vidéos marketing générées peuvent contiennent des mots vulgaires et de mauvaise qualité. Un mauvais contenu, une fois apparu dans les publicités, nuira non seulement à l'image de la marque, mais provoquera également le dégoût du public.
À cet égard, Volcano Engine fournit un ensemble complet de moteurs de détection des risques de contenu ciblés. Grâce à sa prise en charge de contenu multimodal, ses modèles de risque diversifiés et ses fonctions d'évaluation des risques en temps réel, il crée une solution de gestion des risques complète et efficace pour les entreprises. .
Parmi eux, pour répondre à la question de la diversité des risques dans les supports marketing, le moteur de détection a intégré des centaines de modèles de risques. Par exemple, le modèle de détection de la terminologie publicitaire adapté à la copie marketing peut déterminer avec précision si la copie contient des termes absolus, de la fausse propagande et du contenu illégal qui incite à la consommation, tandis que le modèle de détection de la qualité de l'image et des droits d'auteur adapté aux vidéos marketing peut déterminer si la copie contient ; termes absolus, fausse propagande et contenu illégal qui incite à la consommation. S'il contient de mauvaises images et un contenu de mauvaise qualité, et s'il existe une possibilité de contrefaçon.
De plus, afin de convertir efficacement les utilisateurs cibles, les entreprises investissent souvent massivement dans diverses activités marketing, telles que les récompenses des nouveaux arrivants, les récompenses de tâches, etc., afin d'augmenter la fidélité des utilisateurs. Cependant, ces mécanismes de récompense tentants peuvent également devenir de la « viande grasse » aux yeux des entreprises illégales, qui utilisent des failles pour tricher et s'approprier les fonds de marketing de l'entreprise.
Par exemple, lorsqu'un constructeur automobile menait des activités de marketing en ligne, il rencontrait deux problèmes épineux : une fausse assistance et de faux essais routiers. Après avoir accédé au produit intelligent de contrôle des risques Volcano Engine, en seulement deux mois, ils ont effectivement identifié 1,08 million de comportements anormaux, plus de 30 000 comptes anormaux et plus de 20 000 appareils anormaux, et le montant du stop loss direct a atteint 500 000 yuans. Réduisez efficacement le gaspillage des dépenses de marketing, cela améliore également considérablement le taux de conversion des entreprises.
He Kun, directeur principal de NVIDIA Enterprise Developer Community, a présenté un outil super cool - NeMo Guardrails, qui est comme un "garde du corps" pour les grands modèles de langage pour les empêcher de dire des bêtises.
Selon He Kun, NeMo Guardrails est une bibliothèque d'outils open source qui contrôle la sortie de grands modèles de langage en ajoutant des garde-fous programmables pour empêcher les sujets sensibles, les remarques inappropriées et les attaques malveillantes. Il comprend trois garde-fous majeurs : la limitation des sujets, la sécurité des conversations et la défense contre les attaques. Il prend en charge une logique de conversation personnalisée et garantit que la réponse du robot de conversation est conforme aux demandes spécifiques et à la logique prédéfinie.
Le flux de travail de NeMo Guardrails comprend la réception des entrées de l'utilisateur, la mise en correspondance des garde-corps générés, l'exécution du flux logique conversationnel et la génération de réponses de robot. Il définit la logique conversationnelle à l'aide de Colang, un langage de modélisation d'IA conversationnelle hautement lisible et évolutif. De plus, NeMo Guardrails peut être utilisé conjointement avec LangChain pour prendre en charge plusieurs grands moteurs de dialogue de modèles de langage afin d'obtenir une sortie de système de dialogue plus sécurisée.
Adresse de consultation de la revue du cinquième numéro : https://vtizr.xetlk.com/s/7CjTy (ou identifiez le code QR ci-dessous).
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!