Maison >Périphériques technologiques >IA >L'assistant vocal est-il bon ? Bien, mais pas assez bien
Traducteur | Bugatti
Reviewer | Qianshan
Il y a quelques jours, le magazine américain "Business Insider" a rapporté que l'assistant vocal Alexa et les haut-parleurs intelligents d'Amazon perdraient 10 milliards de dollars. La nouvelle intervient alors que les concurrents d'Alexa sont également confrontés à leurs propres difficultés et tentent de trouver des moyens de rentabiliser leurs assistants vocaux.
L'état actuel d'Alexa et des autres assistants vocaux nous rappelle qu'il existe un écart entre développer une technologie de pointe et gagner de l'argent grâce à elle. Les entreprises technologiques sont en train de licencier des travailleurs en prévision de la récession à venir, et les technologies nouvelles mais non rentables devront trouver des moyens de démontrer leur valeur ou être éliminées par les entreprises pour survivre.
Huit ans après le lancement d'Amazon Alexa, nous pouvons tirer les enseignements suivants de la technologie des assistants vocaux et de ce secteur.
De nombreuses innovations ont permis aux assistants vocaux comme Amazon Alexa d'accomplir des tâches qui étaient impossibles il y a plus de dix ans. Les progrès de la reconnaissance vocale automatique aident les assistants à capter et à analyser la voix d'un utilisateur dans différentes conditions de bruit de fond, face à d'autres sons parasites et aux différents accents de l'utilisateur. Un système de traitement du langage naturel basé sur des réseaux neuronaux profonds tels que Transformer, RNN et LSTM aide l'assistant à faire correspondre des voix légèrement différentes avec les commandes correspondantes. Imaginez toutes les différentes façons dont vous pouvez poser des questions sur la météo ou demander une heure. Il existe désormais de nombreuses plates-formes d'applications et API qui permettent aux assistants vocaux de parcourir de grandes quantités d'informations sur le Web et de mapper les commandes vocales aux fonctionnalités de l'application.
Cependant, les assistants vocaux d’aujourd’hui ont des fonctionnalités limitées. De manière générale, Amazon Alexa ne peut effectuer que des tâches simples, telles que chronométrer, écouter de la musique, vérifier la météo et rechercher des informations simples sur Internet.
Ces tâches sont soit très limitées, sans grande marge d'erreur, soit si insensibles que même si l'assistant fait une erreur, cela ne causera pas beaucoup de mal.
Une fois que vous souhaitez effectuer des tâches sensibles, nécessitant plusieurs interactions ou de nature multimodale, les assistants vocaux deviennent peu fiables. Prenons l'exemple du shopping. C'est l'une des utilisations importantes initialement prévues par Amazon pour Alexa. Il s’agit d’une tâche sensible car elle implique de l’argent et les utilisateurs souhaitent avoir le moins d’erreurs possible. Il s'agit également d'une tâche complexe car elle nécessite souvent plusieurs étapes et l'utilisateur souhaite voir le produit acheté et pouvoir parcourir les suggestions d'achat et les alternatives. Ceci est difficile à réaliser avec une interface uniquement vocale, tout comme d'autres tâches telles que la planification de réunions.
Vous avez construit un assistant vocal sympa qui peut effectuer une série de tâches avec une précision assez grande, ce que d'autres assistants ne peuvent pas faire. Comment le rentabiliser ? Compte tenu des applications actuelles, il existe plusieurs solutions.
La première solution consiste à vendre du matériel, comme différentes versions d'enceintes intelligentes Amazon Echo, Apple HomePod ou Google Nest. Dans ce cas, la valeur commerciale sera liée au prix de l’appareil, au nombre d’appareils vendus et à la fréquence à laquelle les clients remplacent l’appareil. Cette approche fonctionne pour les smartphones, puisque les gens dépensent des centaines de dollars toutes les quelques années pour mettre à niveau leur iPhone ou leur téléphone Pixel, mais elle ne fonctionne pas pour les haut-parleurs intelligents. Premièrement, les gens ne sont pas disposés à payer un prix élevé pour cela, car ils ne l'utilisent pas souvent. Deuxièmement, il n’y a pas grand-chose à améliorer concernant un haut-parleur intelligent ; il s’agit simplement d’un microphone et d’un haut-parleur, et parfois d’un écran. Les clients n’ont donc aucune raison de les remplacer régulièrement. Enfin, il existe des frais pour la mise à niveau et la maintenance des services cloud prenant en charge les assistants vocaux. Par conséquent, en gros, l’utilisation continue des haut-parleurs intelligents augmentera les coûts pour les fabricants de haut-parleurs intelligents, et ces coûts finiront par dépasser les bénéfices générés par la vente des haut-parleurs.
La deuxième solution est de vendre des services. Dans ce cas, les utilisateurs paient des frais mensuels ou annuels pour utiliser un assistant vocal sur leur téléphone ou leur haut-parleur intelligent. Dans ce cas, votre produit doit avoir suffisamment de valeur pour que les utilisateurs soient prêts à payer pour cela. Pour que ce modèle commercial réussisse, votre produit doit résoudre un problème non résolu ou créer suffisamment de valeur ajoutée pour convaincre les utilisateurs de payer pour cela, réalisant ainsi une adéquation produit/marché. Malheureusement, les tâches effectuées par Amazon Alexa et d'autres assistants vocaux ne sont pas suffisamment précieuses pour que les utilisateurs puissent les payer.
Enfin, vous pouvez considérer Amazon Alexa comme un canal pour attirer les utilisateurs vers d'autres produits rémunérateurs. Par exemple, Amazon pense qu'Alexa permettra aux utilisateurs de faire des achats en ligne plus fréquemment. Cependant, en raison des limitations mentionnées ci-dessus, Alexa n'offre pas une bonne expérience d'achat et les utilisateurs préfèrent toujours utiliser les téléphones mobiles ou les applications Web pour faire leurs achats.
En gros, cela revient à ce que j'ai dit au début. D'un point de vue scientifique et technique, Amazon Alexa est vraiment génial. Mais d’un point de vue produit et commercial, il ne dispose pas des éléments nécessaires pour gagner de l’argent.
La première génération d'assistants vocaux a eu une excellente idée (utiliser la voix comme interface pour interagir avec les ordinateurs) mais n'a pas réussi à créer un modèle économique rentable. Nous l'avons vu avec les casques VR des années 1990 (trop chers et de mauvaise qualité) et les lunettes AR du début des années 2010 (qui n'offraient pas suffisamment de valeur ajoutée pour justifier leur prix). Alexa et Siri restent populaires parce qu'ils ont été développés par des entreprises aux poches profondes qui, dans des conditions normales de marché, peuvent se permettre de perdre de l'argent sur de nouveaux produits jusqu'à ce qu'elles trouvent un modèle commercial (ou abandonnent de nouveaux produits).
Quelle est la prochaine étape pour les assistants vocaux ? J'ai vu plusieurs issues.
Une solution est d'attendre que la technologie de l'IA devienne si performante qu'elle puisse prendre en charge des applications complètement différentes (comme un assistant vocal qui a toujours une longueur d'avance et vous contacte de manière proactive au lieu que vous l'activiez ?)
Une autre solution consiste à passer du modèle actuel d’assistant vocal généraliste à un assistant plus spécialisé verticalement, capable de s’adapter à différentes applications. Cela permettra aux assistants vocaux d'être intégrés dans le contexte et le flux de travail de diverses applications, les rendant ainsi pleinement capables de gérer des tâches complexes en plusieurs étapes. Je pense qu'il peut exister des modèles commerciaux B2B viables sous cette forme, en particulier dans les secteurs qui impliquent de nombreuses opérations manuelles (industrie manufacturière, restaurants et hôtels, etc.). Après tout, les assistants vocaux peuvent améliorer l'efficacité et réduire les coûts. La valeur ajoutée pour les entreprises dépassera de loin la commodité que les consommateurs retirent de l'utilisation de leur téléphone pour parler (tout comme la deuxième génération de Google Glass a trouvé l'adéquation produit/marché dans l'industrie des produits artisanaux).
Je ne sais pas si les haut-parleurs intelligents sans écran finiront par être le bon style pour les futurs assistants vocaux. Beaucoup de nos tâches quotidiennes impliquent des éléments visuels, et les assistants vocaux purs seront d’une utilité limitée. Il reste à voir quel sera le résultat à cet égard.
Amazon n'a pas encore l'intention de tuer Alexa, mais je pense qu'il est peut-être temps de passer à la prochaine génération d'assistants vocaux.
Lien original : https://bdtechtalks.com/2022/11/28/amazon-alexa-revenue/
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!