


ChatGPT a injecté une dose de sang de poule dans l'industrie de l'IA. Tout ce qui était autrefois inimaginable est devenu aujourd'hui une pratique fondamentale.
continue d'attaquer Text-to-3D, considéré comme le successeur de Diffusion(image) et GPT#🎜🎜 #(Texte) , le prochain point chaud frontière dans le domaine de l'AIGC a reçu une attention sans précédent.
Non, un produit appelé ChatAvatar est en phase de test bêta public discret. Il a rapidement attiré plus de 700 000 vues et attention, et est devenu le(Espaces de la semaine) #🎜 🎜 #.
Le modèle 3D généré par la version bêta actuelle peut être directement téléchargé en local avec le matériel PBR. Non seulement cela fonctionne bien, mais plus important encore, c'est
jeu gratuit. Certains internautes se sont exclamés :
C'est tellement cool, j'ai l'impression de pouvoir facilement générer mon propre jumeau numérique. Cela a incité de nombreux internautes à l'essayer et à apporter leurs idées. Certaines personnes ont combiné ce produit avec ControlNet et ont trouvé que l'effet était si délicat et réaliste qu'il était inattendu.
Cet outil Text-to-3D avec un seuil d'utilisation presque nul s'appelle
, lancé par l'IA domestique Créé par l'équipe technologique Yingmo de l'entreprise. Il est entendu qu'il s'agit du premier produit Text to 3D prêt pour la production au monde. Il peut générer des films et des émissions de télévision à l'aide d'un texte simple, comme le nom d'une star ou l'apparence d'un personnage souhaité. . Actifs humains numériques hyper-réalistes de niveau 3D.
L'efficacité est également très élevée. Il ne faut que 30 secondes en moyenne pour créer un visage qui semble réel, même le vôtre.
À l'avenir, le domaine de la génération s'étendra également à d'autres actifs tridimensionnels.
De plus, le modèle a une topologie régulière, un matériau PBR avec une résolution 4k et une liaison. Il peut être directement connecté au pipeline de production de moteurs de production tels que Unity, Unreal Engine et Maya.
Alors, quel genre d'outil de génération 3D est ChatAvatar ? Quelle technologie est utilisée derrière cela ?
Terminez la "peinture" en 30 secondes
Expérimentez personnellement le gameplay de ChatAvatar et constatez qu'on peut dire qu'il n'y a vraiment pas de seuil.
Concrètement, il vous suffit de décrire vos besoins à ChatBot en langue vernaculaire
sous forme de conversation,sur le site officiel, et vous pouvez générer des visages 3D à la demande, et « peau humaine » réaliste recouvrant un modèle ajusté. Pendant tout le processus de conversation, ChatBot
guideraen fonction des besoins de l'utilisateur pour comprendre ses réflexions sur le modèle requis de manière aussi détaillée que possible.
Au cours de l'expérience, nous avons décrit à ChatBot une telle image 3D que nous souhaitons générer :
Cliquez sur le bouton Générer à gauche. En moins de 10 secondes en moyenne, les premiers prototypes de 9 visages 3D différents générés à partir de la description apparaîtront à l'écran.
Faites glisser avec la souris, vous pouvez également faire pivoter la tête et zoomer pour voir plus en détail les effets locaux, les pores et l'acné sont bien visibles :
Il est à noter que si l'utilisateur est un expert en ingénierie rapide, il peut également terminer la génération en saisissant directement l'invite dans la case de gauche.
Enfin, en un clic de téléchargement, vous pouvez obtenir une tête numérique 3D directement connectée au moteur de production et pilotable :
#🎜🎜 #
; deuxièmement, a une grande durée de génération, et les traits du visage peuvent être modifiés , et il peut également générer des masques, des tatouages, etc. qui s'adaptent au visage, comme celui-ci : # 🎜🎜#
Selon la vidéo promotionnelle officielle, ChatAvatar peut encore générer des personnages au-delà de la catégorie humaine, tels que des personnages de cinéma et de télévision des œuvres telles qu'Avatar :
# 🎜🎜#
Le plus important est que ChatAvatar résout les problèmes de compatibilité entre les modèles 3D et le rendu traditionnel logiciel.
Cela signifie que les actifs 3D générés par ChatAvatar peuvent être directement intégrés dans les processus de production de jeux et de films et de télévision. Bien sûr, avant d'être officiellement connecté au processus industriel, ChatAvatar a attiré des milliers d'artistes et de professionnels de l'art pour participer à la première série de tests bêta publics, et des sujets connexes sur Twitter en ont reçu près d'un. millions de vues et d'attention.
N'importe quel tweet peut avoir plus de 50 000 vues.
Ce n'est pas pour rien que j'ai accumulé beaucoup « d'eau du robinet ». Regardez le visage 3D d'Einstein, qui ne dit pas ça. ça y ressemble vraiment ?#🎜 🎜##🎜🎜 #
En fait, pour les anciens concepteurs ou entreprises de l'industrie 3D, la plupart des applications d'IA de synthèse texte en 3D ne sont pas inefficaces, mais elles restent très difficiles à mettre en œuvre dans le processus de conception industrielle.
On dit que l'IA remplacera les humains. En fait, il n'est pas si facile de la remplacer uniquement dans le domaine du Text-to-3D.
La plus grande difficulté est de faire en sorte que les éléments générés par l'IA répondent aux exigences de l'industrie en matière d'actifs 3D de la
norme.
Comment comprenez-vous la
Industry Standardici ? Du point de vue de la conception artistique 3D professionnelle, il y a au moins trois aspects : Qualité, contrôlabilité et vitesse de génération.
La première chose est la qualité. En particulier pour les industries du cinéma, de la télévision et du jeu qui mettent l'accent sur les effets visuels, afin de générer des actifs 3D répondant aux exigences du pipeline, les « règles tacites de l'industrie » telles que la régularité topologique et la précision du mappage de texture sont les premières étapes à suivre pour les produits d'IA. Hom.
Prenons l'exemple de la régularité de la structure topologique. Cela fait essentiellement référence au caractère raisonnable du routage des actifs 3D.
Pour les ressources 3D, la régularité de la topologie affecte souvent directement l'effet d'animation, l'efficacité du traitement de modification et la vitesse de dessin de la texture de l'objet :
Selon l'introduction de la conception artistique 3D de l'industrie, le coût en temps de la retopologie manuelle est souvent plus élevé que cela de rendre le modèle 3D lui-même plus haut, même en multiples. Cela signifie que peu importe la fraîcheur des actifs 3D générés par le modèle IA, si la régularité topologique générée ne répond pas aux exigences, le coût ne peut pas être fondamentalement réduit. Sans parler de la précision des textures.
△Le projet ChatAvatar de Shadow Eye Technology a considérablement amélioré la qualité, la vitesse et la compatibilité standard de la génération par rapport aux travaux précédents
Prenons comme exemple les textures PBR couramment requises par les industries actuelles du jeu, du cinéma et de la télévision. , y compris Une série de cartes telles que la carte de réflectivité et la carte normale sont équivalentes aux « couches » de fichiers PSD d'images 2D et sont l'une des conditions indispensables à la production de pipelines d'actifs 3D.
Cependant, les actifs 3D actuels générés par l'IA forment souvent un « tout », et il est rare de pouvoir générer indépendamment des effets de texture PBR qui répondent aux besoins de l'environnement industriel.
La seconde est la contrôlabilité. Pour l'IA générative, comment rendre le contenu généré plus « contrôlable » est une autre exigence majeure mise en avant par l'industrie du CG pour cette technologie.
Prenons l'exemple de la célèbre industrie 2D. Avant l'émergence de ControlNet, l'industrie de l'AIGC 2D était dans un état de « progrès semi-obscur ».
En d'autres termes, l'IA peut générer des images d'objets de catégories spécifiées, mais ne peut pas générer d'objets de postures spécifiées. L'effet de génération dépend entièrement de l'ingénierie rapide et de la « métaphysique ».
Après l'émergence de ControlNet, la contrôlabilité de la génération d'images IA 2D a été améliorée à pas de géant. Cependant, pour l'IA 3D, afin de générer des actifs avec les effets correspondants, cela dépend encore dans une large mesure de l'ingénierie rapide professionnelle.
La dernière chose est la vitesse de génération. Par rapport à la conception artistique 3D, l’avantage de la génération IA est la rapidité. Cependant, si la vitesse et l’effet du rendu IA ne peuvent pas égaler ceux du rendu manuel, alors cette technologie ne pourra toujours pas apporter d’avantages à l’industrie.
Prenons comme exemple le NeRF, actuellement très populaire dans la technologie de l'IA, son industrialisation est confrontée à des problèmes de compatibilité de rapidité et de qualité.
Lorsque la qualité de la génération est élevée, la génération 3D basée sur NeRF prend souvent beaucoup de temps ; cependant, si la vitesse est recherchée, même les actifs 3D générés par NeRF ne peuvent pas du tout être utilisés industriellement.
Mais même si ce problème est résolu, comment rendre NeRF compatible avec les moteurs grand public de l'industrie traditionnelle du CG sans perdre en précision reste un énorme problème.
Il n'est pas difficile de découvrir à partir du processus de normalisation industrielle ci-dessus qu'il existe deux goulots d'étranglement majeurs dans la mise en œuvre de la plupart des applications de texte IA dans les applications 3D :
L'un est que le projet d'invite doit être complété manuellement , ce qui est difficile pour les non-professionnels de l'IA ou pour ceux qui ne comprennent pas que l'IA n'est pas assez conviviale pour les concepteurs ; une autre raison est que les ressources 3D générées ne répondent souvent pas aux normes de l'industrie et ne peuvent pas être utilisées même si elles semblent bonnes.
En réponse à ces deux points, ChatAvatar a apporté deux solutions spécifiques et efficaces.
D'une part, ChatAvatar réalise une deuxième voie en plus de l'ingénierie des invites de saisie manuelle, et constitue également un raccourci plus adapté aux gens ordinaires : décrire les besoins par le biais d'un dialogue direct via le « Mode Partie A ».
Le Twitter officiel de l'équipe indique que pour réaliser cette fonctionnalité, ChatAvatar a développé une méthode de conversion des descriptions conversationnelles en fonctionnalités de portrait basées sur les capacités de GPT.
Les concepteurs n'ont qu'à continuer à discuter avec GPT et à décrire le « sentiment » qu'ils souhaitent :
GPT peut automatiquement aider à terminer le projet d'invite et envoyer les résultats à l'IA :
En d'autres termes, si ControlNet est le "Game Changer" de l'industrie 2D, alors pour l'industrie 3D, ChatAvatar, qui peut convertir du texte en 3D, équivaut à un changeur de jeu dans l'industrie.
D'un autre côté, le plus important est que ChatAvatar est parfaitement compatible avec le pipeline CG, c'est-à-dire que les actifs générés répondent aux exigences de l'industrie en termes de topologie, de contrôlabilité et de vitesse.
Cela signifie non seulement qu'après avoir généré des ressources 3D, le contenu téléchargé peut être directement importé dans divers logiciels de post-production pour un montage secondaire, avec une plus grande contrôlabilité ; #Dans le même temps, les modèles générés et les cartes de matériaux de haute précision peuvent également obtenir des effets de rendu extrêmement réalistes lors des rendus ultérieurs.
Afin d'obtenir un tel effet, l'équipe a développé un framework de génération 3D progressive DreamFace pour ChatAvatar.
La clé réside dans les données sous-jacentes utilisées pour entraîner le modèle, qui sont les
. Sur la base de cet ensemble de données, DreamFace peut terminer efficacement la génération d'
actifs 3D au niveau du produit, c'est-à-dire que les actifs générés ont une topologie, des matériaux et des liaisons réguliers. DreamFace comprend principalement trois modules : la génération de géométrie, la diffusion de matériaux basée sur la physique et la génération de capacités d'animation.
En introduisant une base de données 3D externe, DreamFace peut directement produire des actifs conformes au processus CG.
△L'effet du rendu généré par les actifs
△Page d'accueil du projet ChatAvatar
文生图
a obtenu des résultats grâce au modèle de diffusion, les gens ont commencé à s'attendre à ce queText Generation 3D ait les mêmes performances étonnantes . Une fois que la technologie de création 3D de l’IA générative aura mûri, la création de contenu tel que la réalité virtuelle et la vidéo décollera.
La startup d'IA derrière
影视科技 a été incubée par le laboratoire MARS de l'Université des sciences et technologies de Shanghai en 2020. Après sa création, elle a reçu deux cycles d'investissement de Qiji Chuangtan et graines de séquoia.
L'entreprise se concentre sur la recherche et la production d'infographie et d'IA générative. En 2021, avant que l'AIGC ne fasse d'énormes vagues, la société avait déjà lancé Wand, la première application de peinture AIGC ToC en Chine, et le produit était autrefois en tête de la partition de l'AppStore.
Et cette équipe tournée vers l'avenir et déjà bien connue dans l'industrie, l'âge moyen n'est que de 25 ans#🎜 🎜#.
Après avoir spécifiquement ancré le premier scénario de commercialisation sur les personnes numériques, ChatAvatar est leur dernière avancée dans cette direction en profitant de l'AIGC. En tant que produit nouvellement lancé, ChatAvatar a dépassé les attentes de l'équipe Shadow Eye en termes d'effets de produit tels que la compatibilité, l'achèvement et la précision. Cependant, selon les mots de Wu Di, le processus pour arriver ici était « très embarrassant ». La raison principale n'est rien d'autre que le "manque de monde". À l'heure actuelle, Shadow Eye a progressé dans la technologie de génération 3D multicatégories, et la prochaine étape consiste à lancer des « grands modèles générés en 3D ».#🎜." 🎜#Vous pouvez voir, la technologie derrière ChatAvatar a été construite à partir de zéro, révélant l'innovation continue d'une start-up d'IA et le désir de l'entreprise pour les talents, petits et grands, elle a également révélé que sous la vague de l'AIGC, chaque segment veut partir d'Un cœur qui fait surface sous l'eau.
Êtes-vous prêt à adopter l'IA générative et à changer la donne dans le domaine du Text-to-3D ?
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Introduction Dans l'ingénierie rapide, «Graph of Thought» fait référence à une nouvelle approche qui utilise la théorie des graphiques pour structurer et guider le processus de raisonnement de l'IA. Contrairement aux méthodes traditionnelles, qui impliquent souvent des s linéaires

Introduction Félicitations! Vous gérez une entreprise prospère. Grâce à vos pages Web, campagnes de médias sociaux, webinaires, conférences, ressources gratuites et autres sources, vous collectez 5000 identifiants de messagerie par jour. La prochaine étape évidente est

Introduction Dans l'environnement de développement logiciel au rythme rapide d'aujourd'hui, garantissant des performances optimales d'application est cruciale. La surveillance des mesures en temps réel telles que les temps de réponse, les taux d'erreur et l'utilisation des ressources peuvent aider

«Combien d'utilisateurs avez-vous?» il a poussé. "Je pense que la dernière fois que nous avons dit était de 500 millions d'actifs hebdomadaires, et cela croît très rapidement", a répondu Altman. "Vous m'avez dit que cela a doublé en quelques semaines", a poursuivi Anderson. «J'ai dit que le priv

Introduction Mistral a publié son tout premier modèle multimodal, à savoir le pixtral-12b-2409. Ce modèle est construit sur les 12 milliards de paramètres de Mistral, Nemo 12b. Qu'est-ce qui distingue ce modèle? Il peut maintenant prendre les deux images et Tex

Imaginez avoir un assistant alimenté par AI qui non seulement répond à vos requêtes mais rassemble également de manière autonome des informations, exécute des tâches et gère même plusieurs types de données - texte, images et code. Cela semble futuriste? En ce

Introduction L’industrie financière est la pierre angulaire du développement de tout pays, car elle stimule la croissance économique en facilitant des transactions efficaces et une disponibilité du crédit. La facilité avec laquelle les transactions se produisent et le crédit

Introduction Les données sont générées à un rythme sans précédent à partir de sources telles que les médias sociaux, les transactions financières et les plateformes de commerce électronique. Gérer ce flux continu d'informations est un défi, mais il offre un


Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

SublimeText3 Linux nouvelle version
Dernière version de SublimeText3 Linux

Dreamweaver Mac
Outils de développement Web visuel

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

mPDF
mPDF est une bibliothèque PHP qui peut générer des fichiers PDF à partir de HTML encodé en UTF-8. L'auteur original, Ian Back, a écrit mPDF pour générer des fichiers PDF « à la volée » depuis son site Web et gérer différentes langues. Il est plus lent et produit des fichiers plus volumineux lors de l'utilisation de polices Unicode que les scripts originaux comme HTML2FPDF, mais prend en charge les styles CSS, etc. et présente de nombreuses améliorations. Prend en charge presque toutes les langues, y compris RTL (arabe et hébreu) et CJK (chinois, japonais et coréen). Prend en charge les éléments imbriqués au niveau du bloc (tels que P, DIV),

VSCode Windows 64 bits Télécharger
Un éditeur IDE gratuit et puissant lancé par Microsoft