


ChatGPT a injecté une dose de sang de poule dans l'industrie de l'IA. Tout ce qui était autrefois inimaginable est devenu aujourd'hui une pratique fondamentale.
continue d'attaquer Text-to-3D, considéré comme le successeur de Diffusion(image) et GPT#🎜🎜 #(Texte) , le prochain point chaud frontière dans le domaine de l'AIGC a reçu une attention sans précédent.
Non, un produit appelé ChatAvatar est en phase de test bêta public discret. Il a rapidement attiré plus de 700 000 vues et attention, et est devenu le(Espaces de la semaine) #🎜 🎜 #.
Le modèle 3D généré par la version bêta actuelle peut être directement téléchargé en local avec le matériel PBR. Non seulement cela fonctionne bien, mais plus important encore, c'est
jeu gratuit. Certains internautes se sont exclamés :
C'est tellement cool, j'ai l'impression de pouvoir facilement générer mon propre jumeau numérique. Cela a incité de nombreux internautes à l'essayer et à apporter leurs idées. Certaines personnes ont combiné ce produit avec ControlNet et ont trouvé que l'effet était si délicat et réaliste qu'il était inattendu.
Cet outil Text-to-3D avec un seuil d'utilisation presque nul s'appelle
, lancé par l'IA domestique Créé par l'équipe technologique Yingmo de l'entreprise. Il est entendu qu'il s'agit du premier produit Text to 3D prêt pour la production au monde. Il peut générer des films et des émissions de télévision à l'aide d'un texte simple, comme le nom d'une star ou l'apparence d'un personnage souhaité. . Actifs humains numériques hyper-réalistes de niveau 3D.
L'efficacité est également très élevée. Il ne faut que 30 secondes en moyenne pour créer un visage qui semble réel, même le vôtre.
À l'avenir, le domaine de la génération s'étendra également à d'autres actifs tridimensionnels.
De plus, le modèle a une topologie régulière, un matériau PBR avec une résolution 4k et une liaison. Il peut être directement connecté au pipeline de production de moteurs de production tels que Unity, Unreal Engine et Maya.
Alors, quel genre d'outil de génération 3D est ChatAvatar ? Quelle technologie est utilisée derrière cela ?
Terminez la "peinture" en 30 secondes
Expérimentez personnellement le gameplay de ChatAvatar et constatez qu'on peut dire qu'il n'y a vraiment pas de seuil.
Concrètement, il vous suffit de décrire vos besoins à ChatBot en langue vernaculaire
sous forme de conversation,sur le site officiel, et vous pouvez générer des visages 3D à la demande, et « peau humaine » réaliste recouvrant un modèle ajusté. Pendant tout le processus de conversation, ChatBot
guideraen fonction des besoins de l'utilisateur pour comprendre ses réflexions sur le modèle requis de manière aussi détaillée que possible.
Au cours de l'expérience, nous avons décrit à ChatBot une telle image 3D que nous souhaitons générer :
Cliquez sur le bouton Générer à gauche. En moins de 10 secondes en moyenne, les premiers prototypes de 9 visages 3D différents générés à partir de la description apparaîtront à l'écran.
Faites glisser avec la souris, vous pouvez également faire pivoter la tête et zoomer pour voir plus en détail les effets locaux, les pores et l'acné sont bien visibles :
Il est à noter que si l'utilisateur est un expert en ingénierie rapide, il peut également terminer la génération en saisissant directement l'invite dans la case de gauche.
Enfin, en un clic de téléchargement, vous pouvez obtenir une tête numérique 3D directement connectée au moteur de production et pilotable :
#🎜🎜 #
; deuxièmement, a une grande durée de génération, et les traits du visage peuvent être modifiés , et il peut également générer des masques, des tatouages, etc. qui s'adaptent au visage, comme celui-ci : # 🎜🎜#
Selon la vidéo promotionnelle officielle, ChatAvatar peut encore générer des personnages au-delà de la catégorie humaine, tels que des personnages de cinéma et de télévision des œuvres telles qu'Avatar :
# 🎜🎜#
Le plus important est que ChatAvatar résout les problèmes de compatibilité entre les modèles 3D et le rendu traditionnel logiciel.
Cela signifie que les actifs 3D générés par ChatAvatar peuvent être directement intégrés dans les processus de production de jeux et de films et de télévision. Bien sûr, avant d'être officiellement connecté au processus industriel, ChatAvatar a attiré des milliers d'artistes et de professionnels de l'art pour participer à la première série de tests bêta publics, et des sujets connexes sur Twitter en ont reçu près d'un. millions de vues et d'attention.
N'importe quel tweet peut avoir plus de 50 000 vues.
Ce n'est pas pour rien que j'ai accumulé beaucoup « d'eau du robinet ». Regardez le visage 3D d'Einstein, qui ne dit pas ça. ça y ressemble vraiment ?#🎜 🎜##🎜🎜 #
En fait, pour les anciens concepteurs ou entreprises de l'industrie 3D, la plupart des applications d'IA de synthèse texte en 3D ne sont pas inefficaces, mais elles restent très difficiles à mettre en œuvre dans le processus de conception industrielle.
On dit que l'IA remplacera les humains. En fait, il n'est pas si facile de la remplacer uniquement dans le domaine du Text-to-3D.
La plus grande difficulté est de faire en sorte que les éléments générés par l'IA répondent aux exigences de l'industrie en matière d'actifs 3D de la
norme.
Comment comprenez-vous la
Industry Standardici ? Du point de vue de la conception artistique 3D professionnelle, il y a au moins trois aspects : Qualité, contrôlabilité et vitesse de génération.
La première chose est la qualité. En particulier pour les industries du cinéma, de la télévision et du jeu qui mettent l'accent sur les effets visuels, afin de générer des actifs 3D répondant aux exigences du pipeline, les « règles tacites de l'industrie » telles que la régularité topologique et la précision du mappage de texture sont les premières étapes à suivre pour les produits d'IA. Hom.
Prenons l'exemple de la régularité de la structure topologique. Cela fait essentiellement référence au caractère raisonnable du routage des actifs 3D.
Pour les ressources 3D, la régularité de la topologie affecte souvent directement l'effet d'animation, l'efficacité du traitement de modification et la vitesse de dessin de la texture de l'objet :
Selon l'introduction de la conception artistique 3D de l'industrie, le coût en temps de la retopologie manuelle est souvent plus élevé que cela de rendre le modèle 3D lui-même plus haut, même en multiples. Cela signifie que peu importe la fraîcheur des actifs 3D générés par le modèle IA, si la régularité topologique générée ne répond pas aux exigences, le coût ne peut pas être fondamentalement réduit. Sans parler de la précision des textures.
△Le projet ChatAvatar de Shadow Eye Technology a considérablement amélioré la qualité, la vitesse et la compatibilité standard de la génération par rapport aux travaux précédents
Prenons comme exemple les textures PBR couramment requises par les industries actuelles du jeu, du cinéma et de la télévision. , y compris Une série de cartes telles que la carte de réflectivité et la carte normale sont équivalentes aux « couches » de fichiers PSD d'images 2D et sont l'une des conditions indispensables à la production de pipelines d'actifs 3D.
Cependant, les actifs 3D actuels générés par l'IA forment souvent un « tout », et il est rare de pouvoir générer indépendamment des effets de texture PBR qui répondent aux besoins de l'environnement industriel.
La seconde est la contrôlabilité. Pour l'IA générative, comment rendre le contenu généré plus « contrôlable » est une autre exigence majeure mise en avant par l'industrie du CG pour cette technologie.
Prenons l'exemple de la célèbre industrie 2D. Avant l'émergence de ControlNet, l'industrie de l'AIGC 2D était dans un état de « progrès semi-obscur ».
En d'autres termes, l'IA peut générer des images d'objets de catégories spécifiées, mais ne peut pas générer d'objets de postures spécifiées. L'effet de génération dépend entièrement de l'ingénierie rapide et de la « métaphysique ».
Après l'émergence de ControlNet, la contrôlabilité de la génération d'images IA 2D a été améliorée à pas de géant. Cependant, pour l'IA 3D, afin de générer des actifs avec les effets correspondants, cela dépend encore dans une large mesure de l'ingénierie rapide professionnelle.
La dernière chose est la vitesse de génération. Par rapport à la conception artistique 3D, l’avantage de la génération IA est la rapidité. Cependant, si la vitesse et l’effet du rendu IA ne peuvent pas égaler ceux du rendu manuel, alors cette technologie ne pourra toujours pas apporter d’avantages à l’industrie.
Prenons comme exemple le NeRF, actuellement très populaire dans la technologie de l'IA, son industrialisation est confrontée à des problèmes de compatibilité de rapidité et de qualité.
Lorsque la qualité de la génération est élevée, la génération 3D basée sur NeRF prend souvent beaucoup de temps ; cependant, si la vitesse est recherchée, même les actifs 3D générés par NeRF ne peuvent pas du tout être utilisés industriellement.
Mais même si ce problème est résolu, comment rendre NeRF compatible avec les moteurs grand public de l'industrie traditionnelle du CG sans perdre en précision reste un énorme problème.
Il n'est pas difficile de découvrir à partir du processus de normalisation industrielle ci-dessus qu'il existe deux goulots d'étranglement majeurs dans la mise en œuvre de la plupart des applications de texte IA dans les applications 3D :
L'un est que le projet d'invite doit être complété manuellement , ce qui est difficile pour les non-professionnels de l'IA ou pour ceux qui ne comprennent pas que l'IA n'est pas assez conviviale pour les concepteurs ; une autre raison est que les ressources 3D générées ne répondent souvent pas aux normes de l'industrie et ne peuvent pas être utilisées même si elles semblent bonnes.
En réponse à ces deux points, ChatAvatar a apporté deux solutions spécifiques et efficaces.
D'une part, ChatAvatar réalise une deuxième voie en plus de l'ingénierie des invites de saisie manuelle, et constitue également un raccourci plus adapté aux gens ordinaires : décrire les besoins par le biais d'un dialogue direct via le « Mode Partie A ».
Le Twitter officiel de l'équipe indique que pour réaliser cette fonctionnalité, ChatAvatar a développé une méthode de conversion des descriptions conversationnelles en fonctionnalités de portrait basées sur les capacités de GPT.
Les concepteurs n'ont qu'à continuer à discuter avec GPT et à décrire le « sentiment » qu'ils souhaitent :
GPT peut automatiquement aider à terminer le projet d'invite et envoyer les résultats à l'IA :
En d'autres termes, si ControlNet est le "Game Changer" de l'industrie 2D, alors pour l'industrie 3D, ChatAvatar, qui peut convertir du texte en 3D, équivaut à un changeur de jeu dans l'industrie.
D'un autre côté, le plus important est que ChatAvatar est parfaitement compatible avec le pipeline CG, c'est-à-dire que les actifs générés répondent aux exigences de l'industrie en termes de topologie, de contrôlabilité et de vitesse.
Cela signifie non seulement qu'après avoir généré des ressources 3D, le contenu téléchargé peut être directement importé dans divers logiciels de post-production pour un montage secondaire, avec une plus grande contrôlabilité ; #Dans le même temps, les modèles générés et les cartes de matériaux de haute précision peuvent également obtenir des effets de rendu extrêmement réalistes lors des rendus ultérieurs.
Afin d'obtenir un tel effet, l'équipe a développé un framework de génération 3D progressive DreamFace pour ChatAvatar.
La clé réside dans les données sous-jacentes utilisées pour entraîner le modèle, qui sont les
. Sur la base de cet ensemble de données, DreamFace peut terminer efficacement la génération d'
actifs 3D au niveau du produit, c'est-à-dire que les actifs générés ont une topologie, des matériaux et des liaisons réguliers. DreamFace comprend principalement trois modules : la génération de géométrie, la diffusion de matériaux basée sur la physique et la génération de capacités d'animation.
En introduisant une base de données 3D externe, DreamFace peut directement produire des actifs conformes au processus CG.
△L'effet du rendu généré par les actifs
△Page d'accueil du projet ChatAvatar
文生图
a obtenu des résultats grâce au modèle de diffusion, les gens ont commencé à s'attendre à ce queText Generation 3D ait les mêmes performances étonnantes . Une fois que la technologie de création 3D de l’IA générative aura mûri, la création de contenu tel que la réalité virtuelle et la vidéo décollera.
La startup d'IA derrière
影视科技 a été incubée par le laboratoire MARS de l'Université des sciences et technologies de Shanghai en 2020. Après sa création, elle a reçu deux cycles d'investissement de Qiji Chuangtan et graines de séquoia.
L'entreprise se concentre sur la recherche et la production d'infographie et d'IA générative. En 2021, avant que l'AIGC ne fasse d'énormes vagues, la société avait déjà lancé Wand, la première application de peinture AIGC ToC en Chine, et le produit était autrefois en tête de la partition de l'AppStore.
Et cette équipe tournée vers l'avenir et déjà bien connue dans l'industrie, l'âge moyen n'est que de 25 ans#🎜 🎜#.
Après avoir spécifiquement ancré le premier scénario de commercialisation sur les personnes numériques, ChatAvatar est leur dernière avancée dans cette direction en profitant de l'AIGC. En tant que produit nouvellement lancé, ChatAvatar a dépassé les attentes de l'équipe Shadow Eye en termes d'effets de produit tels que la compatibilité, l'achèvement et la précision. Cependant, selon les mots de Wu Di, le processus pour arriver ici était « très embarrassant ». La raison principale n'est rien d'autre que le "manque de monde". À l'heure actuelle, Shadow Eye a progressé dans la technologie de génération 3D multicatégories, et la prochaine étape consiste à lancer des « grands modèles générés en 3D ».#🎜." 🎜#Vous pouvez voir, la technologie derrière ChatAvatar a été construite à partir de zéro, révélant l'innovation continue d'une start-up d'IA et le désir de l'entreprise pour les talents, petits et grands, elle a également révélé que sous la vague de l'AIGC, chaque segment veut partir d'Un cœur qui fait surface sous l'eau.
Êtes-vous prêt à adopter l'IA générative et à changer la donne dans le domaine du Text-to-3D ?
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Jeux de bouleversement: révolutionner le développement de jeux avec les agents de l'IA Les bouleversements, un studio de développement de jeux composé d'anciens combattants de géants de l'industrie comme Blizzard et Obsidian, est sur le point de révolutionner la création de jeux avec son plat innovant alimenté par AI

Stratégie de robotaxi d'Uber: un écosystème de co-hail pour les véhicules autonomes Lors de la récente conférence Curbivore, Richard Willder d'Uber a dévoilé sa stratégie pour devenir la plate-forme de co-hail pour les fournisseurs de robotaxi. Tirant parti de leur position dominante dans

Les jeux vidéo s'avèrent être des terrains de test inestimables pour la recherche de pointe de l'IA, en particulier dans le développement d'agents autonomes et de robots du monde réel, contribuant même potentiellement à la quête de l'intelligence générale artificielle (AGI). UN

L'impact de l'évolution du paysage du capital-risque est évident dans les médias, les rapports financiers et les conversations quotidiennes. Cependant, les conséquences spécifiques pour les investisseurs, les startups et les fonds sont souvent négligées. Venture Capital 3.0: un paradigme

Adobe Max London 2025 a fourni des mises à jour importantes au Creative Cloud and Firefly, reflétant un changement stratégique vers l'accessibilité et l'IA générative. Cette analyse intègre des idées à partir d'informations pré-événement avec Adobe Leadership. (Remarque: Adob

Les annonces de Llamacon de Meta présentent une stratégie complète d'IA conçue pour rivaliser directement avec des systèmes d'IA fermés comme celles d'OpenAI, tout en créant simultanément de nouveaux flux de revenus pour ses modèles open-source. Cette approche multiforme cible BO

Il existe de graves différences dans le domaine de l'intelligence artificielle sur cette conclusion. Certains insistent sur le fait qu'il est temps d'exposer les "nouveaux vêtements de l'empereur", tandis que d'autres s'opposent fortement à l'idée que l'intelligence artificielle n'est que une technologie ordinaire. Discutons-en. Une analyse de cette percée d'IA innovante fait partie de ma colonne Forbes en cours qui couvre les dernières avancées dans le domaine de l'IA, y compris l'identification et l'explication d'une variété de complexités d'influence influentes (cliquez ici pour voir le lien). L'intelligence artificielle en tant que technologie commune Premièrement, certaines connaissances de base sont nécessaires pour jeter les bases de cette discussion importante. Il existe actuellement une grande quantité de recherches dédiées au développement de l'intelligence artificielle. L'objectif global est d'atteindre l'intelligence générale artificielle (AGI) et même la super intelligence artificielle (AS) possible (AS)

L'efficacité du modèle d'IA d'une entreprise est désormais un indicateur de performance clé. Depuis le boom de l'IA, l'IA générative a été utilisée pour tout, de la composition des invitations d'anniversaire à l'écriture du code logiciel. Cela a conduit à une prolifération du mod de langue


Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

mPDF
mPDF est une bibliothèque PHP qui peut générer des fichiers PDF à partir de HTML encodé en UTF-8. L'auteur original, Ian Back, a écrit mPDF pour générer des fichiers PDF « à la volée » depuis son site Web et gérer différentes langues. Il est plus lent et produit des fichiers plus volumineux lors de l'utilisation de polices Unicode que les scripts originaux comme HTML2FPDF, mais prend en charge les styles CSS, etc. et présente de nombreuses améliorations. Prend en charge presque toutes les langues, y compris RTL (arabe et hébreu) et CJK (chinois, japonais et coréen). Prend en charge les éléments imbriqués au niveau du bloc (tels que P, DIV),

Navigateur d'examen sécurisé
Safe Exam Browser est un environnement de navigation sécurisé permettant de passer des examens en ligne en toute sécurité. Ce logiciel transforme n'importe quel ordinateur en poste de travail sécurisé. Il contrôle l'accès à n'importe quel utilitaire et empêche les étudiants d'utiliser des ressources non autorisées.

MantisBT
Mantis est un outil Web de suivi des défauts facile à déployer, conçu pour faciliter le suivi des défauts des produits. Cela nécessite PHP, MySQL et un serveur Web. Découvrez nos services de démonstration et d'hébergement.

Adaptateur de serveur SAP NetWeaver pour Eclipse
Intégrez Eclipse au serveur d'applications SAP NetWeaver.

VSCode Windows 64 bits Télécharger
Un éditeur IDE gratuit et puissant lancé par Microsoft
