Maison  >  Article  >  Périphériques technologiques  >  Le casque d’Apple arrive, est-ce le sauveur des humains virtuels de l’IA ou un météore ?

Le casque d’Apple arrive, est-ce le sauveur des humains virtuels de l’IA ou un météore ?

王林
王林avant
2023-06-11 11:16:001068parcourir

Auteur|Su Xiaoru

Le casque d’Apple arrive, est-ce le sauveur des humains virtuels de l’IA ou un météore ?

AIGC est si populaire, le Metaverse a-t-il été oublié ?

Avec la sortie des nouvelles lunettes AR Vision Pro d'Apple au prix de 24 000 yuans, l'AR et la VR, en sommeil depuis un certain temps, sont de nouveau au centre de toutes les attentions.

Qui est le premier à se préparer à l'AR et à la VR, et le premier à s'enthousiasmer à nouveau ? Bien sûr, il s’agit d’une série d’entreprises qui créent des personnes virtuelles et numériques. La technologie humaine virtuelle est une technologie très étroitement intégrée au divertissement. Dans le cadre du concept antérieur du métaverse et de l’ère actuelle de l’AIGC, les humains virtuels disposent de nombreux endroits où ils peuvent être intégrés aux points chauds.

Combiné au concept AIGC, c'est le thème le plus important de l'industrie au premier semestre de cette année. Au début de ce mois, le clone numérique de la célébrité Internet « Hanzo Forest » a été lancé. Les utilisateurs peuvent profiter de services vocaux, téléphoniques et autres sur une base mensuelle ou annuelle. Puisque l’IA remplace les conducteurs humains, les humains numériques peuvent travailler 24 heures sur 24 et 7 jours sur 7, augmentant ainsi considérablement la capacité de production.

Le processus de diffusion en direct mentionné ici est piloté par la performance de personnes réelles, c'est-à-dire les « personnes du milieu », qui sont l'un des « genres traditionnels » de personnes virtuelles. Avec l’évolution continue de l’intelligence artificielle, entièrement pilotée par des programmes ou l’IA, fournir des questions et des réponses sur une base adaptable est devenu une autre direction majeure du développement de l’industrie humaine virtuelle.

La voie technique pour réaliser des humains virtuels IA est actuellement divisée en deux types : l'une consiste à privatiser et à déployer de grands modèles, et l'autre consiste à mener un développement secondaire ciblé basé sur des modèles open source existants.

Le casque d’Apple arrive, est-ce le sauveur des humains virtuels de l’IA ou un météore ? Tableau 1 Classification des types des trois entreprises humaines virtuelles interviewées dans cet article Tabulation/Entertainment Capitalism

Dans cet article, Entertainment Capitalism vous présentera trois développeurs typiques de technologies humaines virtuelles pour explorer les changements que l'IA a apportés à leur développement de produits et à leurs modèles commerciaux.

La plate-forme de contenu virtuel AIGC Yunbo utilise le « Little K Live Broadcaster » pour les diffuseurs en direct comme support pour explorer et construire un écosystème de diffusion en direct approfondi de manière gamifiée ;

Zhongke Shenzhi, qui se concentre sur la technologie humaine virtuelle d'IA générative de bout en bout, se concentre sur la « diffusion automatique » de marchandises pour les commerçants. Il vient de publier son propre grand modèle pour améliorer considérablement l'effet de l'interaction humaine virtuelle entre questions et réponses ;

Mejike, une société de services logiciels intelligents multimodaux, fournit non seulement des ancres virtuelles entièrement automatiques aux entreprises, mais utilise également les données internes de l'entreprise pour former des modèles propriétaires et cultiver la base de données interne et le moteur de recherche de l'entreprise.

Le casque d’Apple arrive, est-ce le sauveur des humains virtuels de l’IA ou un météore ?

Quatre façons d'ouvrir AIGC

De nombreux présentateurs et téléspectateurs de la diffusion en direct de Station B ne connaîtront jamais la diffusion en direct de Xiao K. Xiao K Live Ji utilise une caméra RVB pour collecter des données d'action d'image 2D et utilise des algorithmes pour générer des données d'action 3D, formant ainsi un fossé technique. Les utilisateurs peuvent directement utiliser Xiao K Live Ji pour créer leur propre personne virtuelle de diffusion en direct.

"Il nous a fallu 3 ans pour construire l'algorithme sous-jacent, disposer d'un ensemble de données d'entraînement privé, et le produit a obtenu les premiers résultats."

En 2017, Mei Song a quitté son emploi de producteur de jeux Linekong Interactive et a rejoint l'industrie de l'intelligence artificielle, créant Yunbo Technology, le développeur de Xiao K Live Broadcasting Girl. La double expérience des industries du jeu et de l’IA rend également le modèle commercial de Yunbo tout à fait unique.

Cartographie de l'IA par Entertainment Capital

Le casque d’Apple arrive, est-ce le sauveur des humains virtuels de l’IA ou un météore ? "Le champ d'activité de notre entreprise comprend à la fois ToB et ToC. Les produits incluent la capture de mouvement Xiao K AI, le dessin AI, le moteur humain virtuel, etc. Nous disposons également d'une guilde MCN auto-gérée et d'une base d'ancrage. De plus, l'entreprise est également confrontée en direct diffusion, jeux, télévision Il fournit des personnes virtuelles et des services de contenu virtuel aux entreprises à travers trois scénarios commerciaux principaux.

Zhongke GenSense, qui se concentre sur la technologie humaine virtuelle d'IA générative de bout en bout, a officiellement publié son propre grand modèle le 10 mai, appelé « GenSense Digital Intelligence Jiang Shang ».

"Après qu'Open AI a annoncé la méthode de formation, la difficulté d'admission aux grands modèles est devenue plus faible. La volonté des entreprises de construire leurs propres grands modèles dépend principalement de l'espace commercial des grands modèles. " expliquer. "Début 2020, nous avons commencé à faire un travail de formation cross-modal basé sur le transformateur, et nous avons également de l'expérience dans le nettoyage des données."

"Nous développons de grands modèles principalement sous deux aspects. Premièrement, la future formation multimodale sera basée sur de grands modèles de langage, et les algorithmes sous-jacents dans les domaines verticaux doivent s'appuyer sur de grands modèles. Deuxièmement, de nombreux clients ont proposé un déploiement privatisé. ce qui nécessite un calcul. La puissance peut être réduite. Si nous nous connectons à d’autres grands modèles, nous ne pourrons pas obtenir le code source et les ensembles de données. »

Le casque d’Apple arrive, est-ce le sauveur des humains virtuels de l’IA ou un météore ?

Le champ d'activité de Zhongke Shenzhi, en plus de la diffusion virtuelle en direct, des employés numériques, etc., comprend également les activités de déploiement de privatisation côté B pour les entreprises financières, médicales, gouvernementales et d'entreprise. Le système d'interaction et de réponse humaine virtuelle en temps réel de l'entreprise "Yun Xiaoqi", l'outil de commerce électronique et de diffusion en direct humain virtuel Yuanverse "Treasure Box Auto Broadcast & Virtual Assistant Broadcast", et le système de génération d'animation rapide AI "Automatic Animation " ont tous été lancés.

Actuellement, les clients de « diffusion automatique » de Zhongke Shenzhi représentent plus de 70 % des commerçants de marques de milieu à bas de gamme utilisant des humains virtuels IA sur Tmall, Taobao, JD.com et d'autres plateformes. Ils ont récemment lancé un produit d'assistant virtuel qui permet à des personnes réelles et virtuelles d'apparaître en même temps.

Le casque d’Apple arrive, est-ce le sauveur des humains virtuels de l’IA ou un météore ?

"Notre objectif est de créer une œuvre humaine virtuelle de bout en bout. Une fois que l'utilisateur a saisi le texte, celui-ci peut être directement et automatiquement modélisé en un personnage 3D, et des expressions d'action peuvent être générées en temps réel pour former une sortie de contenu." Cheng Weizhong a souligné que l'entreprise devrait fournir aux entreprises une solution complète de route à chaîne.

L'un des labels que Maijike Technology se donne est « cross-modal ». La société se concentre sur les domaines des actifs numériques intelligents et de la génération intelligente. Ses principaux produits sont la production de contenu intelligent, la diffusion virtuelle intelligente en direct et l'interaction intelligente personnalisée pour des milliers de personnes. Et le nouveau produit récemment lancé au Forum de Zhongguancun - la Station spatiale d'intelligence numérique, tridimensionnelle, en temps réel et intelligente, sont ses points forts.

Dès 2016, Maijike Technology a commencé à entrer dans le domaine de l'AIGC, a déclaré le fondateur et président Fu Yingna.

« Nous n'utilisons pas d'étalonnage manuel du corpus de données, mais construisons des données basées sur une technologie non structurée. Par exemple, nous pouvons traiter différents documents de données dans l'entreprise en couches, créer un moteur de recherche multimodal pour l'entreprise et laisser l'entreprise. les données génèrent intelligemment du contenu, facile à réaliser une interaction.

De nombreuses entreprises effectuent des déploiements de privatisation pour les entreprises, mais il est difficile pour les petites et moyennes entreprises de créer de grands modèles. Fu Yingna estime que leur avantage réside dans l'innovation combinatoire basée sur de grands modèles open source. les modèles peuvent être combinés en parallèle ou en série dans l'application." La technologie sous-jacente de la technologie Maijike est un algorithme hiérarchique. Une telle combinaison d'algorithmes nécessite une faible puissance de calcul et peut être construite à faible coût et avec une grande efficacité. Elle peut itérer des ressources basées sur de petits échantillons de données et finalement former une intelligence évolutive. »

Le casque d’Apple arrive, est-ce le sauveur des humains virtuels de l’IA ou un météore ?

Où est la marge de profit ?

Les diffusions humaines virtuelles en direct sont principalement divisées en trois types : les diffusions de divertissement, les diffusions de jeux et les diffusions en direct de commerce électronique. Mei Song de Yunbo estime : « Du point de vue de la valeur, les humains virtuels conviennent mieux aux deux premiers. Le cœur du scénario de transport de marchandises est la marchandise. Tant que quelque chose est bon marché, quelqu'un l'achètera certainement. , il sera difficile pour quiconque de le vendre. Les personnes virtuelles Le streaming en direct ne peut pas résoudre le problème des marchandises.

"Les diffusions virtuelles en direct peuvent améliorer l'incapacité d'interagir instantanément avec les fans pendant les diffusions en direct. Les fans peuvent récompenser les présentateurs virtuels et changer de vêtements à tout moment, rendant le contenu de diffusion virtuelle en direct plus interactif et riche", a déclaré Mei Song, "De haute qualité". Le contenu en direct nécessite définitivement la participation de vraies personnes. »

Ouvrez la station B et vous pourrez voir les utilisateurs de « l’eau du robinet » de Xiao K partout. Mei Song a révélé que le taux de rétention du marché de Xiao K Live Ji dans le domaine des présentateurs virtuels 3D a atteint 90 %, avec plus de 400 000 présentateurs desservant l'ensemble du réseau et plus de 5 000 présentateurs avec des diffusions actives quotidiennes. Parmi tous les outils de capture de mouvement en direct, Xiao K est le seul à être entièrement gratuit côté C.

« Je ne m'attends pas à compter sur les produits de Xiao K Live Ji pour facturer de l'argent. À l'avenir, j'espère utiliser ce produit pour attirer davantage de présentateurs. Ces personnes ont leurs propres fans et trafic. utiliser des scènes spatiales pour créer des jeux interactifs et mener à bien la monétisation du trafic de contenu est similaire au modèle intermodal des jeux. »

Mei Song estime que l'interaction virtuelle en direct sera divisée en trois étapes. L'ère 1.0 était une diffusion quotidienne en direct avec de vraies personnes, offrant des cadeaux, jouant des effets spéciaux et organisant des barrages. 2.0 Les fans peuvent influencer le contenu virtuel de la salle de diffusion en direct ou créer des personnages grâce à des cadeaux de barrage, mais les fans n'ont aucun contrôle. 3.0 est l'espace métaverse. Les fans et les présentateurs peuvent interagir librement dans les émissions en direct. Les fans disposent de joysticks virtuels et ont un contrôle indépendant complet, comme organiser des concerts, jouer du PK, etc. Au second semestre de cette année, Yunbo lancera la « Little K Space Station » similaire au « Metaverse » pour mettre en œuvre la troisième génération de scènes interactives en direct.

Fu Yingna de Maijike Technology estime que différentes plates-formes ont des politiques différentes en matière de diffusions virtuelles en direct. "Douyin ne l'encouragera pas, mais Bilibili l'encouragera probablement. Après tout, les utilisateurs sont différents. À l'avenir, la plateforme pourra avoir une zone de diffusion virtuelle en direct séparée, après tout, il y a un public

."

D'un autre côté, "À long terme, si les personnes virtuelles remplacent les personnes réelles, elles serrent la plateforme et portent atteinte aux intérêts de la plateforme. Elles seront définitivement interdites à l'avenir Cheng Weizhong, un sage de." Zhongke, a déclaré que les précédentes émissions en direct de personnes numériques apportant des marchandises ont explosé. C'est populaire parce que Douyin veut soutenir la vie locale.

Le casque d’Apple arrive, est-ce le sauveur des humains virtuels de l’IA ou un météore ?

"À l'avenir, les diffusions humaines virtuelles en direct doivent être dans une situation gagnant-gagnant avec la plateforme. Les fournisseurs de technologies humaines virtuelles doivent réfléchir clairement à ce dont la plateforme, les utilisateurs et les commerçants ont besoin. Les présentateurs virtuels doivent avoir des capacités de raisonnement et d'analyse qui sont réelles. les gens n'en ont pas, etc. Par exemple, il peut analyser instantanément et déterminer si l'atmosphère d'un barrage est positive ou non. C'est la valeur de l'intelligence artificielle.

Le casque d’Apple arrive, est-ce le sauveur des humains virtuels de l’IA ou un météore ?

AI+VR : Comme l'avenir est brillant

En parlant de grands modèles, Cheng Weizhong a déclaré : « La formation de l'IA profonde nécessite une grande quantité de corpus, qui sont tous des scénarios d'application existants d'OpenAI. Plus important encore, quand la technologie de l'IA profonde peut-elle franchir le seuil, et peut-il y en avoir de nouveaux ? Scénarios d'application. De la même manière, les grands modèles que nous construisons cherchent également à réaliser des avancées décisives dans le domaine des humains virtuels, et nous prévoyons de progresser dans l'interaction avec les scènes humaines virtuelles d'ici un an.

En plus de la vague ChatGPT, Cheng Weizhong a également prêté attention aux Apple Glasses. "La possibilité pour les lunettes AR d'Apple de progresser à long terme dépend non seulement de leur capacité à intégrer techniquement AR et VR, mais plus important encore du modèle commercial, de leur capacité à partager de l'argent avec les développeurs, de manière à inciter les développeurs à se joindre à nous et à créer un écosystème ensemble »

« Avec le développement des lunettes AR, la façon dont le contenu est exprimé va également changer, ce qui offrira également de plus grandes opportunités aux entreprises qui génèrent du contenu 3D et aux humains virtuels. »

En ce qui concerne les Apple Glasses, Mei Song estime que les meilleurs scénarios de mise en œuvre de la réalité virtuelle et du métaverse se trouvent dans les jeux à leurs débuts. "Pourquoi le taux de pénétration et le nombre d'utilisateurs de la VR n'ont-ils pas augmenté ? La raison principale est qu'il n'existe pas de bon contenu basé sur la VR."

Yunbo a investi 30 millions de yuans pour créer les actifs 3D de Xiao K Live Broadcast Ji Zhong. « D'une part, c'est le coût, d'autre part, nous avons des technologies auto-développées telles que le moteur vidéo Xiao K. des années de recherche, nous avons formé nos propres douves. »

"Au second semestre, nous commencerons le développement de produits de conversion multimodaux AIGC, tels que la musique AI et la voix AI ; Xiao K Live Ji lancera une version de capture de mouvement complet du corps avec une seule caméra ; le produit sera également intégré au processus de production d'animation de jeu pour aider les utilisateurs à générer des données d'animation utilisables. De plus, des versions de commerce électronique et de jeu des dessins de Little K seront également lancées.

Bien sûr, ces plans nécessitent également la prise en charge de grands modèles, donc Yunbo utilisera également une grande quantité de données pour entraîner le modèle. L'entreprise dispose déjà d'une équipe d'étiquetage de plusieurs dizaines de personnes.

Fu Yingna a également utilisé le terme mise à niveau pour décrire la situation après que l'AR/VR soit devenu populaire. "Dans la première génération d'Internet, chaque entreprise possède son propre site Web. Dans la deuxième génération d'Internet, chaque entreprise possède sa propre application. La troisième génération d'Internet sera une expérience spatio-temporelle en quatre dimensions et être mis à niveau vers la génération intelligente de contenu 3D, l'intégration du pliage temporel et spatial permet une interaction intelligente en temps réel qui peut être générée de manière H5 et peut apparaître sur des pages Web, des clients et d'autres endroits pour une interaction en temps réel.

La dernière « Station spatiale numérique » créée par Maijike Technology peut établir une « carte de visite numérique » pour les entreprises dans l'espace virtuel. Elle peut être présentée en trois dimensions, visuellement et intelligemment, transcendant les limites du temps et de l'espace physiques réels. fournir aux utilisateurs des cartes de visite individuelles pour mille personnes. Des services intelligents personnalisés pour tous. Cette opération de contenu peut être réalisée via un déploiement privé ou SaaS. C’est la clé pour construire une nouvelle génération de productivité de contenu et d’expérience immersive. C’est également un outil et une plate-forme importante à l’ère de l’économie numérique. Le casque d’Apple arrive, est-ce le sauveur des humains virtuels de l’IA ou un météore ?

Si la technologie AIGC continue de révolutionner les perceptions de l’industrie, elle révolutionne également la technologie humaine virtuelle. Pour les praticiens de la technologie humaine virtuelle, l’engouement pour l’IA déclenché par ChatGPT, couplé aux nouveaux points chauds de l’AR/VR, a généré un double enthousiasme.

Quand il y a trop de nouvelles choses à voir et trop de choses à faire, comment utiliser l'IA pour aider à générer des produits de consommation au contenu sans fin et ouvrir la porte à un nouveau monde est probablement ce dont les fournisseurs de technologie et les clients côté B ont besoin pour résoudre les problèmes. ensemble.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer