Maison >Périphériques technologiques >IA >Revue de la version bêta interne de l'IA de Kuaishou : quel est l'effet de collision entre les grands modèles et les courtes vidéos ?
La « Bataille de centaines de modèles » a récemment ajouté un autre participant. Suite au lancement du grand modèle linguistique de Wenshengwen « Ruyi » le mois dernier, Kuaishou a récemment lancé un grand modèle « Ketu » auto-développé dans le domaine du « Wenshengtu » " ( Couleurs). En tant que plate-forme vidéo courte, « Ketu » de Kuaishou sera naturellement utilisé dans sa propre application. S'appuyant sur le grand modèle Ketu, Kuaishou a également commencé à tester la fonction « AI play review » dans la zone de commentaires vidéo courts, en essayant de débloquer la fonctionnalité. Courte vidéo AIGC+ De nouvelles façons de jouer.
Il est rapporté que « AI Play Review » de Kuaishou est la première fois dans l'industrie à appliquer les capacités AIGC dans la zone de commentaires du scénario commercial principal d'une application à grande échelle. Cette fonction est conçue pour améliorer l'expérience interactive des utilisateurs. dans la zone de commentaires. Les utilisateurs peuvent facilement générer du texte créatif en saisissant un grand nombre d'images dans différents styles pour enrichir l'interaction des commentaires. Les utilisateurs doivent simplement saisir un commentaire texte de 6 mots ou plus dans la zone de commentaire de la courte vidéo, puis cliquer sur le logo « AI » dans le coin inférieur droit de la zone de commentaire pour générer une image de commentaire en un seul clic. Vous pouvez également cliquer sur « Changer la vue » pour passer à plus de styles.
Selon l'équipe Kuaishou AI, grâce à la fonction « AI Play Review », les utilisateurs peuvent exprimer leurs opinions et leurs émotions de manière plus précise et plus intéressante, et avoir des interactions plus pratiques et intéressantes dans la zone de commentaires, sans avoir à rechercher des images ou des images appropriées. expressions, mais peut générer directement une image. Il est entendu que la révision de jeux par l'IA peut générer des images allant de styles courants tels que le cyberpunk, les pixels et l'animation réaliste, à des images avec des styles personnels forts tels que Makoto Shinkai, Hayao Miyazaki et Katsuhiro Otomo
En analysant le contenu saisi par l'utilisateur, dessiner des images sémantiques est devenu une fonction standard de Stable Diffusio, Midjourney et de divers grands modèles d'IA dotés de fonctions de diagramme vincentien sur le marché intérieur. En d'autres termes, l'analyse de l'IA de Kuaishou est essentiellement un outil de peinture d'IA. La technologie qui la sous-tend est principalement basée sur le traitement sémantique naturel de la PNL, et l'identification précise de ce que l'utilisateur veut exprimer est un élément clé
.L'effet de la révision du jeu AI dépend du mot d'invite (Prompt). Selon l’expérience des internautes, si les commentaires textuels contiennent un contenu plus descriptif sur les personnes, les paysages, l’espace, les actions, etc., les images générées seront plus cohérentes avec la situation réelle. Au contraire, s'il y a des descriptions vagues dans les commentaires sans référent spécifique, comme "666" ou "Oh mon dieu ! Ma sœur est tellement géniale !", les résultats générés par l'IA ne seront pas visibles. Par conséquent, cette réalité conduit directement au fait que les critiques de jeux IA pourraient ne pas être appréciées par la plupart des utilisateurs
La question est : à quoi ressemble la zone de commentaires actuelle de la plateforme de vidéos courtes ? En fait, c’est une scène pleine de bons mots, de blagues, de remarques pleines d’esprit et d’autres contenus émotionnels. En raison des caractéristiques des courtes vidéos, notamment une musique de fond magique de lavage de cerveau, des images intensément stimulantes et des mécanismes de récompense incertains, les utilisateurs abandonnent la réflexion et s'y plongent. Par conséquent, les commentaires dans la zone de commentaires ne sont généralement qu'une simple phrase, que les utilisateurs utiliseront pour exprimer clairement leurs goûts, leurs aversions ou leurs opinions
Le résultat de cette réalité est que le contenu produit par les utilisateurs dans la zone de commentaires vidéo courts est fondamentalement émotionnel et manque de contenu qualitatif. Imaginez, s'il ne s'agit que d'un tas d'adjectifs, l'IA sera confrontée à la confusion liée à l'absence de sujet, ce qui signifie que le contenu final généré par l'IA peut être très différent de ce que l'utilisateur souhaite exprimer. Je crois que les amis qui ont utilisé des outils tels que Stable Diffusio et Midjourney savent que si Prompt est principalement constitué d'adjectifs, le résultat du manque de noms est que l'IA se laissera aller.
Même le GPT-4 le plus avancé est en fait imparfait dans l'expérience des émotions humaines. En fait, la capacité de perception émotionnelle de l'IA reste un problème auquel sont confrontés tous les chercheurs en IA à ce stade. À l’heure actuelle, de nombreux grands modèles d’IA sont orientés soit vers des scénarios de productivité sérieux, soit vers des conversations avec des humains, et presque aucune IA n’implique l’expression émotionnelle. De cette façon, il est en fait difficile pour les évaluateurs de jeux IA de Kuaishou de bien faire leur travail. Il serait peut-être bon de ne pas gêner les commentaires des utilisateurs.
Donc, si tel est le cas, pourquoi Kuaishou lance-t-il une revue de jeux IA ? Bien entendu, le but est de rendre le grand modèle du tableau de Vincent « visualisable » et d'avoir une scène réaliste. L'application Kuaishou elle-même est presque le seul produit de Kuaishou destiné au consommateur, donc « AIGC + courte vidéo » est devenu presque la seule carte qu'ils peuvent jouer. En fait, nous pouvons voir ici que Kuaishou, en tant que nouveau géant émergent à l'ère de l'Internet mobile, est encore inférieur aux géants traditionnels tels que BAT en termes d'expérience.
Contrairement à BAT, qui s'est presque transformée en une société Internet d'eau, de charbon et d'électricité, Kuaishou, un groupe de nouveaux géants qui ont grandi à l'ère de l'Internet mobile, présentent aujourd'hui presque tous les caractéristiques d'un seul secteur d'activité de « troncs forts ». et des branches faibles", comme celle de Kuaishou. Le cœur de métier est essentiellement basé sur l'application Kuaishou, tandis que d'autres activités ne sont presque pas encore disponibles. Avant que cette série de concepts d'IA n'éclate, Baidu, qui était autrefois considéré comme solitaire par le monde extérieur, en plus d'un moteur de recherche, a également créé une méthode de saisie, afin que les applications d'IA natives de Baidu puissent être exécutées sur la méthode de saisie de Baidu.
En regardant Kuaishou, à part l'application Kuaishou, où d'autre le grand modèle « tutuable » peut-il être utilisé ? Si Kuaishou souhaite créer une application uniquement pour les grands modèles d'IA, Kuaishou risque de perdre cette opportunité. La situation actuelle est qu'il n'y a en fait aucune différence générationnelle de performances entre les principaux modèles d'IA sur le marché intérieur. L'expérience d'utilisation réelle de chaque modèle est fondamentalement la même, et le choix de l'utilisateur est souvent aussi long qu'il est utile. Même pour les utilisateurs qui souhaitent découvrir le charme des grands modèles d'IA, beaucoup ont téléchargé Baidu Wenxinyiyan, qui présente l'avantage du premier arrivé.
En fait, lorsqu'il s'agit de combiner l'AIGC avec la vidéo, la Station B a peut-être donné le meilleur exemple. Plus tôt cet été, Station B a lancé le compte « AI Video Assistant ». Les utilisateurs n'ont besoin que de @AI Video Assistant dans la zone de commentaire de la vidéo correspondante, et cette dernière peut générer automatiquement un résumé textuel de la vidéo. Pour les longues vidéos de la station B, le résumé et l'organisation de l'assistant vidéo IA peuvent aider les utilisateurs à réaliser l'extraction des informations en peu de temps, il sera donc naturellement bien accueilli par de nombreux utilisateurs.
En tant que produit doté d'attributs de divertissement plus importants, si Kuaishou App souhaite mieux s'intégrer à AIGC, elle doit naturellement répondre aux besoins de divertissement des utilisateurs. Par exemple, générer intelligemment des émoticônes basées sur des commentaires peut être bien plus adapté à l’atmosphère de la plateforme que créer des images de personnes dans la zone de commentaires.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!