Maison  >  Article  >  Périphériques technologiques  >  À la recherche de scènes pour le grand modèle Gemini AI du projet Google Project Ellman exposé

À la recherche de scènes pour le grand modèle Gemini AI du projet Google Project Ellman exposé

PHPz
PHPzavant
2023-12-15 09:46:011075parcourir

为Gemini AI大模型找场景 谷歌Project Ellman项目曝光

L'équipe de Google a proposé l'idée d'utiliser la technologie de l'IA pour traiter les photos des utilisateurs et les informations des requêtes des moteurs de recherche afin d'analyser de manière exhaustive la vie de l'utilisateur. Ce projet s'appelle "Projet Ellmann".

Selon l'idée originale, le projet Ellmann utiliserait LLM (comme Gemini) pour extraire des informations, trouver des modèles spécifiques à partir des photos de l'utilisateur, puis créer un chatbot pour répondre avec précision aux questions. Google affirme qu'Ellmann sera un "conteur de vie personnelle".

Cela semble intéressant, mais Google souhaite-t-il intégrer la fonctionnalité Ellmann dans Google Photos ou dans d'autres produits ? C'est encore inconnu. Google Photos compte plus d'un milliard d'utilisateurs et stocke 4 000 milliards de photos ou de vidéos.

Google utilise actuellement la technologie de l'IA pour optimiser sa gamme de produits, et Ellmann n'est qu'une des façons dont elle peut être utilisée. Il y a quelques jours, Google a lancé Gemini. Dans certains cas, Gemini a même dépassé OpenAI GPT-4

Google a l'intention d'accorder une licence à Gemini aux utilisateurs de Google Cloud. Les utilisateurs peuvent utiliser Gemini pour développer la fonction qu'ils souhaitent. L'avantage le plus important de Gemini est « multimodal », ce qui signifie qu'il peut comprendre plusieurs types d'informations telles que du texte, des images, des vidéos et de l'audio.

Lors d'une récente réunion interne, un responsable de Google Photos a présenté le projet Ellman. Des documents internes montrent que l’équipe de Google estime que de grands modèles linguistiques peuvent être utilisés pour afficher les histoires de vie des utilisateurs dans le monde réel de manière « à vol d’oiseau ».

En lisant des biographies, des dossiers antérieurs, des photos et d'autres documents, Ellman est capable de comprendre la situation plus profondément. Par exemple, en analysant une série de clips, Ellman peut déterminer si les informations touchent au sujet de la vie universitaire.

Une phrase de la diapositive de présentation se lit comme suit : « Nous ne pouvons pas résoudre le problème des vies individuelles sans les regarder de haut. une vue à vol d'oiseau." "Nous regardons vos photos, examinons leurs tags et leurs emplacements, et déterminons si elles appartiennent à un moment significatif." Votre histoire personnelle deviendra plus claire au fur et à mesure que vous vivrez. »

L'équipe Google a également parlé à propos de Ellmann Chat. Qu’est-ce qu’Ellmann Chat ? L'équipe a décrit : « Autant imaginer que lorsque vous l'ouvrez, il sait déjà tout ce qui concerne votre vie personnelle, quelles questions lui poseriez-vous ? »

Par exemple, l'utilisateur a posé une question à Ellmann Chat : « Est-ce que je avez-vous des questions?" "Élever un chien." AI a répondu que le propriétaire a un chien, et a également dit le nom du chien, et a également dit qu'il y a deux personnes dans la famille qui aiment le plus être avec les chiens, et quels sont les noms des membres de la famille.

Un autre problème est que le propriétaire souhaite déménager, l'IA peut donc proposer un choix de villes similaires au cadre de vie existant. Ellmann peut répondre à ces questions. De plus, Ellmann connaît également les habitudes alimentaires de l'utilisateur.

Par exemple, lorsqu'un utilisateur souhaite acheter quelque chose, ce qui l'intéresse, quels sont ses projets de travail et de voyage, Ellmann peut trouver la réponse en analysant les photos. Ellmann sait également quels sites Web les utilisateurs aiment visiter et quelles applications ils utilisent. Un porte-parole de Google a révélé : « Google Photos a toujours espéré utiliser la technologie de l'intelligence artificielle pour aider les utilisateurs à rechercher des photos et des vidéos. Avec LLM, nous pouvons offrir une expérience plus pratique. À l'heure actuelle, Ellmann en est encore aux premiers stades de l'exploration interne, et il faudra du temps pour déterminer s'il sera finalement lancé. Google doit s'assurer qu'Ellmann est vraiment utile aux utilisateurs, tout en tenant également compte de la confidentialité et de la sécurité des utilisateurs. De nombreuses entreprises technologiques souhaitent le faire. Le projet Ellmann n'est qu'une des nombreuses nouvelles technologies qui utilisent les nouvelles technologies pour créer des souvenirs personnels plus personnalisés pour les utilisateurs.

Qu'il s'agisse de Google Photos ou d'Apple Photos, ils analysent tous des photos, recherchent des modèles, puis créent des albums photo. Google Photos peut regrouper automatiquement des photos similaires dans des albums pour faciliter la recherche par les utilisateurs. Apple a déclaré en juin que son logiciel serait capable d'identifier des personnes, des chiens ou des chats sur des photos après une mise à niveau. Les utilisateurs n'auront qu'à prononcer le nom de la personne et le logiciel vous aidera à retrouver ses photos.

Cela semble génial, mais les technologies de Google et d'Apple présentent encore des imperfections et des erreurs surviennent parfois. En 2015, l'intelligence artificielle d'Apple et de Google a identifié par erreur une personne noire comme étant un chimpanzé, une erreur qui a suscité de nombreuses blagues. Même aujourd’hui, ce genre d’erreur est encore difficile à éviter

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer