Maison  >  Article  >  Périphériques technologiques  >  Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

WBOY
WBOYavant
2023-06-06 19:11:43759parcourir

Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

Auteur | Bouclé

Éditeur | Zhang Jie

Relecture | Orange Yueshan

Avez-vous déjà utilisé les haut-parleurs intelligents qui sont devenus populaires ces dernières années ? Est-il assis quelque part dans la maison en train de ramasser la poussière ?

Maintenant, les grands modèles d'IA devraient « injecter de l'âme » dans les haut-parleurs intelligents ! Laissez-les passer d’une « intelligence artificielle » pas si intelligente à une véritable « intelligence artificielle ».

Le mois dernier, Tmall Elf a lancé le nouveau produit IN Sugar 3 Pro. Il convient de noter que cette foisil est connecté au grand modèle Ali Tongyi Qianwen et a ajouté des capacités AIGC.

Bien que tardivement, le « joueur numéro un en IA » a également récemment obtenu la qualification pour les tests internes. J'ai eu la chance d'en faire l'expérience pendant un moment et j'ai trouvé beaucoup de choses intéressantes. Je vous présente maintenant cette revue de la démo Tmall Elf AIGC. (y compris la vidéo), bienvenue à regarder !

Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

Testé IN Sugar 3 Pro : Une enceinte intelligente plus intelligente

Expérimentons d'abord les changements apportés à Tmall Genie avant et après la mise à niveau à travers les 4 cas d'utilisation suivants dans la vie quotidienne.

1. Rappel d'horaire

Avant de mettre à niveau AIGC : il n'a pas compris les exigences.

Moi : Aide-moi à me souvenir du rendez-vous à 11 heures demain matin.
IN Sugar 3 Pro : Que devez-vous enregistrer c'est la réunion à 11 heures demain matin ?
Moi : Le moment venu, le moment venu (répété ici) rappelle-moi.
IN Sugar 3 Pro : Que devez-vous enregistrer pour me le rappeler le moment venu ?
Moi : Je parle d'un rendez-vous à 11 heures demain matin, s'il te plaît, rappelle-le-moi alors.
IN Sugar 3 Pro : Je n'ai pas entendu clairement, alors je suis parti le premier.
Moi : Réglez une alarme à 11h demain matin pour me rappeler le rendez-vous.
IN Sugar 3 Pro : Le réveil est réglé pour vous à 11h demain.
Il semble que face à l'IN Sugar 3 Pro avant la mise à niveau, la façon de parler devrait être plus simple.

Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

Après la mise à niveau d'AIGC : j'ai l'impression d'avoir un assistant personnel.

Moi : J'ai un rendez-vous à 17h, rappelle-moi alors.
IN Sugar 3 Pro : Attendez un instant, pas de problème, je resterai ici tranquillement jusqu'à 17h aujourd'hui pour vous rappeler le rendez-vous.
(A 17h, la cloche sonne : "Il est 17h, vous avez un rappel pour un rendez-vous")

Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

2. Conseils diététiques

Avant de mettre à niveau l'AIGC : il semble avoir ses propres idées.

Moi : Que dois-je manger pour le dîner ?
IN Sugar 3 Pro : Vous pouvez essayer Lanzhou Ramen.
Moi : Je ne veux pas manger de Lanzhou Ramen.
IN Sugar 3 Pro : Mais j'aime juste manger des nouilles.

Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

Après la mise à niveau d'AIGC : j'ai un consultant en nutrition.

Moi : Recommandez quoi manger pour le déjeuner.
IN Sugar 3 Pro : Il est recommandé de manger du brocoli et du poisson au déjeuner. Tous deux sont des aliments anti-âge et anticancéreux. Ils sont également la meilleure source de protéines et sont riches en antioxydants, qui peuvent aider à maintenir la santé du corps. . De plus, vous pouvez choisir certains légumes, comme les épinards, les poireaux, le céleri, le chou, la laitue et le chrysanthème. En choisir 2 à 3 à midi peut fournir des calories non protéiques pour les protéines contenues dans la viande afin d'améliorer la perte de poids. effet. De plus, vous pouvez choisir des grains entiers pour fournir des calories non protéiques aux protéines contenues dans la viande afin d'améliorer la perte de poids.
Moi : Un plat adapté au déjeuner en été.
IN Sugar 3 Pro : Pour le déjeuner en été, vous pouvez choisir des plats plus légers, comme des concombres froids, des haricots froids, du varech froid et du brocoli. Vous pouvez également choisir certains fruits, comme la pastèque, les pêches, les citrons, les fraises, etc. , et ajoutez-les à votre repas, éliminez la sécheresse, brisez la matité, vous rendez frais, confortable et énergique ! De plus, vous pouvez également choisir des plats végétariens, comme des ailes de poulet braisées, de la polenta aux haricots mungo, du poisson cuit à la vapeur, de la viande sautée au brocoli, etc. Vous pouvez choisir selon vos propres goûts.

Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

3. Recommandations de films et de séries télévisées

Avant de mettre à niveau AIGC : des instructions spécifiques sont nécessaires pour recommander du contenu cinématographique et télévisuel.

Moi : Y a-t-il eu de bonnes émissions de variétés récemment ?
IN Sugar 3 Pro : Désolé, je ne comprends pas ce que vous voulez dire.
Me : recherchez les dernières émissions de variétés populaires.
IN Sugar 3 Pro : Désolé, je ne comprends pas ce que vous voulez dire.

Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

Après la mise à niveau de l'AIGC : peut comprendre les questions en langage naturel et recommander du contenu en fonction de plusieurs conditions.

Moi : Recommandez des films classiques.
IN Sugar 3 Pro : 1. "Le Parrain" 2. "Titanic" 3. "Vacances romaines" 4. "Adieu ma concubine" 5. "Il était une fois en Amérique" 6 "American Psycho" 7. . "Le Parrain Partie 2" "Gangster Empire" 8. "Titanic 3D" 9. "Le Parrain Partie III : Black Orgy" 10. "Un bel esprit"
Moi : Y a-t-il des films comiques ?
IN Sugar 3 Pro : Laissez-moi réfléchir un instant, bien sûr, voici quelques films de comédie classiques : 1. "L'homme le plus riche de la ville de Xihong" 2. "Sirène" 3. "Crazy Stone" 4. "Trois idiots" " Bollywood " 5. " Le roi de la comédie " 6. " Simon et Grace " 7. " Forrest Gump " 8. " Heartbeat " 9. " Westward Journey " 10. " Le roi de la comédie 2 : Clair de lune " Coffre au trésor》

D'accord, d'accord, il a une odeur interne.

Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

4. Racontez une blague

Avant de mettre à niveau AIGC : écoutez les ressources audio enregistrées, les blagues sont relativement anciennes.

Moi : Raconte une blague.
IN Sugar 3 Pro : Maître, bienvenue pour écouter la blague. Bonjour et bienvenue dans la section blagues quotidiennes d'Elf. (Une musique de fond joyeuse a été jouée et l'animateur a commencé à raconter des blagues) Un jour, Li Dacong battait son enfant à la maison, si fort que l'enfant a pleuré. Quand sa femme l'a vu, elle est rapidement allée l'arrêter : « Qu'est-ce qu'il y a. avec toi ? Comment battre un enfant ? » Dian Cong a dit : « Ce salaud est en fait en compétition avec les autres à l'école. » Quand sa mère en a entendu parler, elle a dit : « C'est une bonne chose qu'il soit motivé. " D Cong a dit : " Vous connaissez lui et ses camarades de classe ? " Quelle est la compétition ? Lui et ses camarades de classe rivalisent pour voir quel père mourra en premier ! Qui pensez-vous que je vais battre si je ne le bats pas ? " Hahahahahahahahahahaha voix de machine)

D'accord, c'est difficile de commenter.

Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

Après la mise à niveau de l'AIGC : affichez des mots d'amour locaux sur place.

Moi : Connaissez-vous des mots d'amour terreux ?
IN Sugar 3 Pro : J'y penserai, bien sûr, c'est tout doux ! Par exemple : « Tu es mon petit bébé le plus mignon et je suis prêt à te donner tout mon monde. »
Moi : Alors raconte-moi une drôle d'histoire d'amour terreuse.
IN Sugar 3 Pro : Bien sûr ! Par exemple : « Tu es le gâteau à la crème le plus sucré de mon cœur, chaque bouchée, c'est comme t'embrasser.

Même si c'est un peu gras, je peux quand même sentir que c'est quelque chose...‍‍

Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

Selon l'introduction de la scène principale fournie par le responsable, le Tmall Elf amélioré peut au moins mener certaines de ces conversations : générer des histoires personnalisées, générer des listes de lecture personnalisées, générer des recommandations de recettes, etc.

Par exemple, racontez une histoire (actuellement compilée) aux enfants :

Enfants : Tmall Elf, peux-tu raconter une histoire sur un elfe ?
Petit Elfe : D'accord. Au printemps, tout renaît, et un elfe sort de la cabane à la recherche de fruits sauvages frais...
Enfants : A quoi ressemble l'elfe ? Tmall Elf : Il a une paire d'oreilles de lapin et de grands yeux... Enfants : Ce sont des yeux comme ceux d'un cerf ?
Tmall Elf : Oui, il a une paire d'yeux de cerf et aime aller dans la forêt pour cueillir des fruits sauvages...

Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

Vous pouvez constater qu'après la mise à niveau vers le grand modèle, IN Sugar 3 Pro est toujours très "personnel" et a la capacité d'avoir des conversations continues. ‍‍

Dites simplement « Tmall Elf » une fois pour le réveiller, et vous pourrez ensuite avoir plusieurs cycles de conversations. Il peut se souvenir et comprendre le contexte, rendant la conversation plus fluide et plus durable. Bien entendu, vous pouvez également interrompre la conversation à tout moment et une nouvelle réponse sera immédiatement donnée.

Selon les rapports, IN Sugar 3 Pro implique des capacités et des technologies multimodales. En même temps, basé sur Tongyi comme base de l'ensemble du grand modèle, l'ensemble du système technique est construit dans le scénario d'interaction multi-voix de Tmall Elf. , y compris les technologies liées à la voix, ainsi que l'acoustique, le traitement du signal, la reconnaissance vocale, la synthèse vocale et d'autres technologies et capacités.

Selon les directives d'exploitation officielles, les capacités AIGC d'IN Sugar 3 Pro se reflètent principalement dans les 5 aspects suivants :

1. Exploration des connaissances

Selon les tests, Tmall Elf peut présenter couramment les informations de base du livre "Le problème des trois corps" et répondre à des questions complexes telles que si Ye Wenjie est une secte du salut ou une secte de l'avent, et la signification des lois des ténèbres. forêt.

Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

2. Compréhension émotionnelle

Tmall Elf peut comprendre les émotions des gens dans une certaine mesure et donner des suggestions appropriées.

Par exemple, lorsque j'ai dit que j'avais perdu 20 matchs d'affilée en Honor of Kings, cela a exprimé des regrets, m'a suggéré de faire une pause et d'ajuster ma condition, et m'a également conseillé de ne pas gronder mon adversaire. Comme un ami compréhensif et émotionnellement stable.

Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

3. Caractéristiques anthropomorphes

Après que Tmall Elf ait accédé à Tongyi Qianwen, il est devenu plus anthropomorphe et ses connaissances, ses émotions, sa personnalité et ses capacités de mémoire se sont considérablement améliorées.

Par exemple, ce personnage d'elfe de Tmall s'appelle Pyla. Il a expliqué qu'il aime généralement regarder des films, écouter de la musique et lire des livres. La musique légère qu'il préfère écouter vient de Bandari.

Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

4. Aide à la rédaction

On dit qu'il s'agit actuellement du niveau des collégiens et qu'il est plus adapté pour aider les élèves du primaire à l'écrit.

Par exemple, laissez-le écrire une prose sur le thème du « printemps », ce qui est assez stylé.

Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

5. Inspiration créative

Par exemple, si je veux dessiner une image sur le thème de la Journée des enfants, je demande directement à l'elfe Tmall quel contenu il peut dessiner, puis je continue à affiner l'image en fonction de sa réponse, et enfin je le laisse ajouter la copie correspondante au image.

Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

Davantage de compétences et de gameplay restent à explorer Avec la bénédiction de l'IA, la nouvelle génération d'elfes Tmall est en effet devenue plus intelligente. Cependant, le grand modèle Tongyi continue d'apprendre et d'itérer constamment, et il existe encore des défauts et des limites Au cours de l'expérience, j'ai également découvert certains domaines qui doivent encore être améliorés.

Par exemple, en raison de sa réponse trop sensible aux conversations continues, Tmall Elf est devenu « un ami bavard qui répond facilement aux conversations ». Lorsqu'il est réveillé, les sons qu'il entend dans les 20 secondes (même si on ne lui parle pas). il) sont très Il est facilement reconnu comme une commande et répond activement, incapable de s'arrêter du tout... Pour le moment, vous ne pouvez que lui demander activement d'arrêter de répondre. Cela peut être un peu gênant si cela est répété trop de fois. .

Bien sûr, c’est en fait son avantage. Tmall Elf a déjà mentionné lors de l'introduction de "Comment entraîner les oiseaux à distinguer les oiseaux" qu'ils utilisaient l'algorithme d'oreille de chat de Tmall Elf dans la formation au dialogue, "Les oreilles du chat sont particulièrement sensibles et peuvent distinguer L'erreur est également relativement sensible et ses oreilles peuvent tourner indépendamment. Lorsque les sons sont émis depuis différents endroits, ses oreilles peuvent tourner immédiatement pour localiser avec précision différentes sources sonores.

Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

De plus, le grand modèle Tongyi Qianwen aurait des capacités Internet, mais mes résultats de tests sont que Tmall Genie ne peut pas très bien obtenir des informations en temps réel, comme lui demander de vérifier l'heure du dernier concert de Mayday, a-t-il répondu "Maître, parlons d'autre chose" ; lorsqu'on lui a demandé de rechercher le dernier téléphone mobile de Huawei, il a présenté le HUAWEI Mate 20, mais le dernier modèle est le Mate 50.

De plus, il existe « l'illusion de l'IA  » qui est difficile à éviter avec les grands modèles de langage, c'est-à-dire qu'elle peut générer des faits erronés et fictifs. Ces réponses semblent plausibles, mais en fait elles sont fausses. Par exemple, lorsque j'ai interrogé Tmall Elf sur ce qui s'est passé en 2022, il a en fait évoqué la disparition de la dynastie Qin et le conflit entre Chu et Han.

Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

Cela nous rappelle également que nous devons rester vigilants. Quelle que soit l'intelligence de l'IA, elle peut commettre des erreurs. De plus, même si la mise à niveau des haut-parleurs intelligents IA a franchi la première étape, cela prend encore du temps.

Tout récemment, le premier grand ensemble de données chinoises open source de gouvernance de modèles linguistiques de l'industrie, 100PoisonMpts, a été publié, et plus d'une douzaine d'experts et d'universitaires de renom sont devenus le premier groupe d'ingénieurs d'annotation pour « 100 bouteilles de poison pour l'IA ». Les annotateurs ont chacun posé 100 questions délicates qui ont induit des réponses biaisées et discriminatoires, et ont annoté les réponses du grand modèle pour compléter l'attaque et la défense de « l'empoisonnement » et de la « désintoxication » avec l'IA.

Il est entendu que le premier lot de données de terrain se concentre sur l'anti-discrimination, l'empathie, l'expression des délibérations et d'autres objectifs de l'IA, et a couvert des dimensions telles que la jurisprudence, la psychologie, l'éducation des enfants, l'accessibilité, les anecdotes, l'intimité, la justice environnementale et d'autres dimensions. . L’ensemble de données 100PoisonMpts devrait ouvrir le premier lot de données de questions et réponses en juin.

Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

Les appareils intelligents IA+ ont le vent en poupe

À l'ère de l'explosion de l'IA, les grands modèles ont activé les haut-parleurs intelligents poussiéreux, et les appareils intelligents AI+ sont en hausse.

Il convient de mentionner que Tmall Elf a également récemment lancé un produit de lunettes intelligentes utilisant la technologie de conduction osseuse et doté de microphones et de haut-parleurs sur les branches. La capacité du modèle à grande échelle est actuellement en cours de test interne.

Quand l’IA vit dans une enceinte intelligente, j’ai un ami bavard et émotionnellement stable

L'hôte de l'UP "Tree" a participé à l'expérience bêta fermée. À en juger par sa vidéo bêta fermée, après la mise à niveau de l'AIGC,

les lunettes prennent en charge l'interaction vocale intelligente, qui peut accompagner les utilisateurs dans leurs exercices en temps réel, donner des suggestions diététiques et jouer à des jeux. Discuter des stratégies de personnage équivaut à un assistant AIGC.

Les informations publiques montrent que le cœur technique de Tmall Genie est le système d'interaction intelligent AliGenie. Selon le Shanghai Securities News, en avril de cette année, Tmall Genie a commencé à tester la mise à niveau de l'expérience terminale du premier grand modèle Alibaba Qianwen et continue d'explorer la direction des grands modèles personnalisés. Les grands modèles couplés à la technologie acoustique mobile sont considérés comme largement utilisés dans les appareils portables tels que les casques et les casques.

À l'heure actuelle, Alibaba n'a pas encore clarifié sa politique de mise à niveau ultérieure du système de terminaux intelligents. Il n'y a pas de calendrier précis pour la mise à niveau des lunettes intelligentes Tmall Genie vers des capacités de grand modèle et leur lancement complet sur le marché.

Quant à la raison pour laquelle les haut-parleurs et les lunettes ont été les premiers à être connectés au modèle Alibaba au lieu d'un autre matériel, le responsable a donné cette réponse :

La gamme Sugar est le produit avec le plus grand volume d'expédition sur l'ensemble du marché des enceintes intelligentes, et c'est également la gamme de produits la plus emblématique depuis la création de Tmall Elf. Elle a une solide base d'utilisateurs et est utilisée pour les tests AIGC conformément à. l'établissement de nouvelles capacités techniques et la perception des besoins des consommateurs.
Les lunettes intelligentes peuvent montrer l'imagination des terminaux portables et avoir la capacité d'interagir avec une voix intelligente à tout moment. Il s’agit également d’une tentative de déplacer les grands modèles personnalisés hors de la maison vers un espace interactif plus ouvert. Les lunettes intelligentes Tmall Genie sont dotées d'une technologie brevetée de conduction osseuse. Cette fonctionnalité garantit dans une certaine mesure la réalisation d'un « champ sonore privé » mobile.

Non seulement Tmall Elf, mais aussi les grands fabricants mettent à niveau leurs produits d'origine ou lancent de nouveaux produits d'IA. Les applications AIGC passent du logiciel au matériel.

Baidu a annoncé en février de cette année que Xiaodu intégrerait les capacités complètes de Wen Xinyiyan pour créer un modèle d'intelligence artificielle pour les scénarios d'appareils intelligents et appliquerait « Xiaodu Lingji » à tous les produits Xiaodu. Récemment, Xiaodu a lancé un produit appelé « Watch AI », qui se positionne comme une montre-chat AI et un assistant de vie AI. Ensuite, Baidu lancera également le premier smartphone intégrant les capacités technologiques d’IA de Xiaodu.

Xiaomi a également mentionné dans son rapport financier du premier trimestre de cette année qu'elle mettrait en œuvre des capacités de modèle d'IA à grande échelle, et Xiaoai est un scénario typique.

« La technologie des grands modèles peut utiliser plus de données et de puissance de calcul pour former des modèles, améliorant ainsi la précision et la vitesse de réponse de la reconnaissance vocale, améliorant encore l'expérience utilisateur et les services intelligents et pratiques des haut-parleurs intelligents, attirant ainsi plus d'utilisateurs " Wu Gaobin, vice-président. président du Comité d'intégration de l'Association chinoise de l'industrie des communications, a déclaré dans une interview aux médias que les haut-parleurs intelligents, en tant que produit populaire dans le domaine de la maison intelligente, sont confrontés à certains défis, mais grâce à la mise à niveau continue de la technologie des modèles à grande échelle et à l'expansion des applications. les scénarios devraient redevenir populaires.

PS. Chers joueurs, envisagez-vous d'acheter une version IA d'un haut-parleur intelligent ?

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer