Maison  >  Article  >  Périphériques technologiques  >  Après la bénédiction des grands modèles, les numériques sont-ils « plus humains » ?

Après la bénédiction des grands modèles, les numériques sont-ils « plus humains » ?

PHPz
PHPzavant
2024-04-12 19:04:10820parcourir

Ancre virtuelle de la langue des signes humaine des Jeux olympiques d'hiver de Pékin, allumage humain numérique des Jeux asiatiques de Hangzhou, journaliste numérique de l'agence de presse Xinhua, astronaute numérique Xiaowei... Alors que de plus en plus d'humains numériques apparaissent dans la vie des gens, l'ensemble de l'industrie humaine numérique est également se développant vers des applications diversifiées et étendues, s’étendant rapidement dans différentes industries et scénarios.

Après la bénédiction des grands modèles, les numériques sont-ils « plus humains » ?

Pour la face C, les personnes numériques aident les utilisateurs à produire du contenu et les aident au travail, par exemple : les personnes numériques pratiquent la langue parlée, jouent à des jeux avec les personnes numériques, etc. ; pour la face B, les personnes numériques sont les personnes numériques ; Les « personnes-outils » de l'entreprise sont utilisées dans les secteurs de la finance, du cinéma et de la télévision, du commerce électronique, de la diffusion en direct et dans d'autres secteurs pour améliorer l'efficacité de la production et des opérations de l'industrie.

Le numérique est une bonne affaire, mais sa mise en œuvre à grande échelle se heurte encore à des difficultés de talent, de coût, de scénarios, de technologie, etc. Parmi eux, le plus critique est le goulot d'étranglement technique. Comment amener les gens du numérique à se débarrasser de l'évaluation du marché selon laquelle « avoir une bonne peau pour rien » est un gros problème.

Cependant, avec l’émergence des grands modèles, le développement des humains numériques semble ouvrir la voie à de nouvelles opportunités.

1. Les grands modèles responsabilisent les personnes numériques

Pour l'industrie, les personnes numériques elles-mêmes ne sont pas nouvelles. Il y a longtemps, afin d'obtenir une présentation haute fidélité en termes d'apparence numérique pour le visionnement humain, le coût de production n'était pas inférieur à celui de la réalisation d'un film de niveau professionnel.

Un rapport de recherche sur l'humain numérique publié par UBS a souligné que le coût d'investissement initial moyen des personnages virtuels avancés est de 30 millions de yuans, et que plus tard, une véritable équipe est nécessaire pour terminer le tournage, le doublage et le montage. En prenant comme exemple le groupe de filles virtuel A-SOUL de Lehua Entertainment, le coût de production d'un single a atteint 2 millions de yuans et le coût d'un concert hors ligne a atteint 20 millions de yuans.

Cependant, ce problème de coût élevé ne résout pas le problème des effets de l’interaction humaine numérique. En raison de son manque d’intelligence, il ressemble plus à un étui en cuir numérique sans âme qu’à un humain numérique.

Le coût élevé, associé à de faibles effets d'interaction, a limité le recours aux humains numériques à des projets expérimentaux au sein de fabricants ou de grandes entreprises clientes.

Par conséquent, alors que les grands modèles génératifs dotés de capacités d'apprentissage dominent le paradigme de la production de contenu, les humains numériques bon marché ciblant un plus large éventail d'utilisateurs de petites et moyennes entreprises et donnant la priorité à la mise en œuvre à grande échelle sont devenus une solution réalisable.

Selon un chercheur en intelligence artificielle, la refonte et l'autonomisation des humains numériques par les grands modèles se traduisent principalement par une réduction des coûts et une amélioration de l'efficacité.

D'un point de vue technique, la construction d'un humain numérique se divise principalement en modélisation, conduite et rendu. Les humains numériques traditionnels s'appuient principalement sur la technologie d'infographie + la capture de mouvements de personnes réelles, ce qui nécessite la collecte d'une grande quantité de données de personnes réelles et une modélisation approfondie, ce qui prend du temps, est peu efficace et coûte cher.

Maintenant, avec le support de grands modèles, grâce à des algorithmes d'IA et sur la base de modèles d'apprentissage profond, de simulation d'action, de simulation d'émotion et d'autres technologies, il suffit de quelques minutes de vidéos en personne réelle et de plusieurs heures de formation avec de grands modèles pour générer des humains numériques réalistes, le coût de production est considérablement réduit.

Non seulement cela, même si le coût des humains numériques est réduit, l'efficacité est également grandement améliorée.

Avant l'émergence des grands modèles, les humains numériques présentaient de petites différences d'apparence et ne pouvaient répondre qu'à des questions « scénarisées » basées sur des scripts unifiés d'entrée.

Avec l'autonomisation des grands modèles, les humains numériques ont une « âme ». Non seulement leur apparence et leurs fonctionnalités peuvent être personnalisées, mais leur intelligence et leur interactivité ont également été grandement améliorées. Par exemple, dans certains scénarios de diffusion en direct, les utilisateurs du numérique peuvent déjà avoir des interactions de base avec le public.

Par exemple, l'humain numérique Xilin publié par Baidu Smart Cloud peut rapidement terminer la construction d'une salle de diffusion en direct en 15 minutes avec la prise en charge de grands modèles, générer automatiquement des discours correspondant aux caractéristiques du produit et permettre des questions-réponses interactives intelligentes.

Dans la salle de diffusion en direct d'une certaine marque de restauration, les présentateurs humains numériques Xilin génèrent automatiquement des compétences vocales de diffusion en direct, notamment l'ouverture des brise-glaces, les émissions d'aide sociale, les discours d'échauffement, les compétences d'appel aux commandes, etc. Dans ce relais diffusé en direct entre des personnes réelles et des personnes numériques de Xi Ling, les utilisateurs ne l'ont pas du tout remarqué.

Ce qui est encore plus surprenant, c'est que dans une comparaison de diffusion en direct réelle de 6 heures, les présentateurs numériques peuvent obtenir 85 % du GMV des présentateurs réels pour seulement 15 % du coût des présentateurs réels.

En plus de la diffusion en direct de marchandises, Baidu Intelligent Cloud Xiling, en tant que première plate-forme humaine numérique en Chine qui reconstruit entièrement de grands modèles, peut également fournir aux entreprises des personnes réelles en 2D, des portraits 3D réalistes et hyperréalistes en 3D, permettant la production vidéo. , employés numériques, porte-parole humain numérique et autres applications.

Par exemple, sur la plateforme XiLing, il suffit de 5 minutes de vidéo en direct pour former des portraits en une demi-heure, enregistrer 100 phrases et générer une bibliothèque sonore exclusive 24 heures sur 24. Par rapport à l'enseignement en direct, le coût est seulement. 30 % du passé, et l'efficacité d'enregistrement est améliorée de 20 fois.

Il n'est pas difficile de constater que les personnes numériques qui ont été remodelées et habilitées par les grands modèles se sont dans une certaine mesure débarrassées de problèmes tels que les prix élevés et la mauvaise interactivité, et apparaissent de plus en plus dans de courtes vidéos et dans des salles de diffusion en direct.

Dans le même temps, les gens du numérique commencent à s'orienter vers davantage d'« identités » - planificateurs financiers bancaires, avocats, enseignants, célébrités décédées... Les gens du numérique deviennent ceux qu'ils veulent être, et c'est aussi une piste de plus en plus fréquentée. . Apporté de nouvelles opportunités.

2. Faire en sorte que les personnes numériques ressemblent davantage à des « humains »

L'émergence des grands modèles a fait « renaître » les personnes numériques et est devenue l'une des pistes entrepreneuriales les plus en vogue aujourd'hui.

Il existe actuellement deux catégories principales de fabricants d'humains numériques sur le marché : l'une est constituée des géants de la technologie représentés par Baidu, Tencent, Huawei, etc., qui développent et lancent des produits humains numériques sur la base de leurs propres avantages dans de grands modèles ; Petits et moyens fabricants basés sur Smart, Mobvoi et Xiangxin Technology.

De nombreux investisseurs dans le domaine de l'intelligence artificielle ont déclaré que l'AIGC (intelligence artificielle générative) en est encore à ses débuts et que peu d'entre elles peuvent être mises en œuvre pour générer des bénéfices. Le numérique est l'une des rares voies de commercialisation qui a été rentable.

Mais avec l'afflux d'un grand nombre d'entrepreneurs, la concurrence industrielle est devenue féroce et homogène, et la piste est progressivement devenue encombrée et involuée.

Une manifestation de l’involution est que les prix baissent de plus en plus. À l'heure actuelle, le prix de la plupart des appareils numériques 2D est tombé à mille yuans, et certains ne coûtent même que quelques centaines de yuans.

Le service de marketing humain numérique du Groupe 360 ​​montre également qu'il est promu auprès des clients via le service SaaS de support de la plateforme cloud de marketing intelligent. Selon la norme de paiement mensuel des utilisateurs membres, le prix d'un humain numérique est aussi bas que . des dizaines de yuans et jusqu'à un ou plus.

Avec l'afflux d'un grand nombre de personnes numériques à faible coût sur le marché, les avatars numériques valant des centaines de dollars sont rapidement présentés comme un « livre de richesse » avec d'énormes profits.

Tard dans la nuit, lorsque les plateformes grand public sont ouvertes, un grand nombre de personnes numériques se rassemblent dans la salle de diffusion en direct. Par la suite, les doutes sur les personnes numériques se sont accrus, tels que les effets trop faux, le marché chaotique, etc., ce qui a entraîné une mauvaise expérience utilisateur.

Certaines personnes dans l'industrie pensent qu'avec l'afflux de plus en plus d'acteurs, certains entrepreneurs ont des capacités techniques limitées et la qualité des produits humains numériques qu'ils produisent varie, ce qui peut facilement conduire à de mauvaises pièces chassant de bonnes pièces.

D'une part, les humains numériques sont principalement utilisés dans des environnements plus simples pour résoudre des problèmes plus élémentaires. Lorsqu'ils changent de scène ou font face à plusieurs cycles de dialogue, ils peuvent ne pas répondre aux bonnes questions ou tomber dans une boucle sans fin, ce qui restreint l'expérience utilisateur. .

D'un autre côté, l'expérience interactive des personnes numériques sous de grands modèles est toujours très différente de celle des personnes réelles. Par exemple, dans le contenu généré par Sora, des problèmes tels que le non-respect des principes physiques et le manque de doigts humains apparaissent. a été largement critiqué, ce qui pourrait en outre provoquer un « effet de vallée étrange » psychologique.

À cet égard, certains experts estiment qu'il est nécessaire d'améliorer encore les capacités d'innovation technologique et l'expérience utilisateur, tout en garantissant l'effet anthropomorphique externe des humains numériques, tout en optimisant l'expérience d'interaction utilisateur, en se concentrant sur le rendu en temps réel, la capture optique, reconstruction tridimensionnelle et interaction homme-machine intelligente Recherche et application de technologies émergentes telles que le traitement du langage naturel, la reconnaissance vocale, la vision par ordinateur, l'IA générative et d'autres technologies.

"L'objectif technique actuel que l'industrie atteint conjointement est de 'comment faire en sorte que les personnes numériques ressemblent davantage à un être humain' et pensent comme un être humain", a déclaré un initié de l'industrie, accélérant la collaboration technologique entre les entreprises pour résoudre le problème. des humains numériques interactifs. Les problèmes techniques de perception émotionnelle, de compréhension sémantique, etc. sont le prochain objectif.

Cette série de défis pointe tous vers le côté technique.

Le « Rapport sur l'indice d'influence humaine numérique virtuelle de Chine » 2024 a souligné qu'à fin février 2024, les données « Recherche de brevets » de l'Office national de la propriété intellectuelle montraient que le nombre de demandes de brevet dans le domaine humain numérique en 2023 a atteint 544, reflétant la forte dynamique de l'industrie et l'innovation approfondie dans la recherche et le développement des technologies de base.

À en juger par les institutions déposant des demandes de brevets liés à l'humain numérique en 2023, les anciens géants de l'Internet représentés par Baidu et Tencent, les principales institutions de communication et financières représentées par China Mobile et la Banque industrielle et commerciale de Chine, Xiaobing Company, Shiyou Technology, Leading Les entreprises numériques représentées par Black Mirror Technology ont formé une structure multi-pouvoirs du côté technologique.

Bien que les principaux fabricants du secteur disposent d'avantages en matière de technologie d'IA, dans le processus de développement rapide de l'industrie, aucune entreprise n'a d'obstacles absolus à la technologie elle-même. Pour tous les fabricants humains numériques, si l’AIGC apporte des opportunités, elle devient aussi le point de départ pour relever des défis.

3. Conclusion

Les gens du numérique sont à l'avant-garde, attirant un afflux important d'entrepreneurs qui veulent une part du gâteau. Mais il est indéniable qu’en tant que technologie jeune, l’humain numérique en est encore à ses débuts et que le marché est encore en cours de culture.

Pour les entreprises humaines numériques qui sont également dans le même océan rouge, ce à quoi elles doivent réfléchir n'est peut-être pas à la manière d'« obtenir des prix bas », mais de rendre les humains numériques « plus humains » grâce à l'avancement continu de la technologie et à l'amélioration. le niveau global de l'industrie. Laissez les gens du numérique « vivre » et créer plus de valeur.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer