Maison >Périphériques technologiques >IA >Google lance l'assistant multimodal Bard : une nouvelle étape vers l'ère de l'IA interactive
Lors d'une conférence de lancement d'un nouveau produit il y a quelques jours, Google a officiellement lancé la nouvelle génération de téléphones phares Android de la série Pixel 8/Pro, équipée de la puce Tensor G3. Cette puce peut exécuter des modèles ML (apprentissage automatique) plus complexes et en ajouter plusieurs. Fonctionnalités d'IA sur le nouveau téléphone Fonctionnalités améliorées, telles que la lecture de pages Web aux utilisateurs dans différentes langues et des voix « plus naturelles », et des assistants virtuels parlant plus naturellement.
Google a souligné que Pixel 8 Pro est le premier téléphone à exécuter le grand modèle de base de Google directement sur l'appareil, avec 150 fois la puissance de calcul du plus grand modèle ML du Pixel 7.
Dans le même temps, Google a annoncé le lancement de "Assistant with Bard" pour les appareils Android et iOS, qui combine la fonction d'assistant personnel du téléphone avec l'IA générative. Les utilisateurs peuvent interagir avec Bard Assistant via du texte, de la voix ou des images - In. en d’autres termes, il possède des capacités multimodales.
Lorsque les utilisateurs demandent « Quels e-mails importants ai-je manqués cette semaine ? », Bard Assistant fournira les services suivants : Premièrement, il listera les points clés et le contenu spécifique de chaque e-mail important et fournira des liens vers les e-mails correspondants. Deuxièmement, cela peut également aider les utilisateurs à extraire les adresses actives et à les afficher dans Google Maps
Si l'utilisateur souhaite publier une photo d'un chiot sur les réseaux sociaux, il lui suffit d'appeler la boîte de dialogue flottante Bard Assistant et de lui demander d'écrire le contenu de la publication. L'assistant Bard reconnaîtra l'image et écrira le contenu correspondant.
Google a annoncé qu'il déploierait bientôt Bard Assistant auprès des premiers testeurs afin d'obtenir des commentaires et de le lancer au public dans les mois à venir.
De plus, Mustafa Suleyman, co-fondateur de DeepMind, a déclaré dans une récente interview que
L'IA générative actuelle n'est qu'une étape technique de transition et entrera ensuite dans l'ère de l'IA interactive L'IA organisera les tâches en fonction des différentes. besoins des utilisateurs en matière de tâches. Autres logiciels et/ou contacter de vraies personnes pour faire le travail.
Il pense que la première vague d'intelligence artificielle s'est principalement concentrée sur la classification - l'apprentissage profond montre que les humains peuvent entraîner l'intelligence artificielle à classer les données d'entrée telles que les images, les vidéos, les audios et les langues. L'humanité est actuellement dans la deuxième vague de « l'intelligence artificielle générative », qui consiste à « saisir des données et générer de nouvelles données ». La troisième vague du futur appartiendra à « l'intelligence artificielle interactive ». « La conversation est l'interface interactive du futur. » Les utilisateurs ne se contentent pas de cliquer sur des boutons et de taper du texte, mais parlent directement à l'intelligence artificielle. pour agir de manière indépendanteTianfeng Securities a souligné que
L'importance des scénarios dans la phase de mise en œuvre des applications d'IA côté C est devenue plus importante, les chatbots, les compagnons d'IA et les scénarios d'outils de production de contenu étant les premiers à être mis en œuvre en termes de vitesse de développement et de progrès de commercialisation. Les applications d’IA dans ces scénarios peuvent dépasser les attentes.
Selon les prévisions des analystes, l’itération de l’intelligence artificielle et l’effet catalyseur des événements ultérieurs continueront de s’accélérer. Au cours du second semestre, la vitesse d'itération des applications et des modèles des entreprises géantes étrangères sera considérablement améliorée et les capacités des chatbots généraux devraient être encore améliorées. Cela peut conduire à des améliorations de l'expérience utilisateur et augmenter encore le nombre d'utilisateursEn outre, Huajin Securities a ajouté que le passage des grands modèles des scénarios généraux aux scénarios verticaux est davantage une exploration de la commercialisation et constitue la force motrice pour que les grands modèles passent de la formation à l'inférence.
Avec le développement et l'amélioration des grands modèles verticaux, l'application de grands modèles est la clé pour ouvrir une plus grande marge de croissance. L'Edge Computing est un marché progressif clair et énorme, et il a maintenant atteint le stade de la mise en œuvre industrielle. Les sociétés de cloud computing, les opérateurs de télécommunications, les fabricants d'équipements, les sociétés CDN, etc. promeuvent tous activement la mise en œuvre industrielle. Le contenu réécrit est : Source : Financial Associated Press
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!