Maison  >  Article  >  Périphériques technologiques  >  Le premier du pays ! SenseTime lance « Ririxin 5o », une évaluation comparative des interactions en streaming multimodal en temps réel avec GPT-4o

Le premier du pays ! SenseTime lance « Ririxin 5o », une évaluation comparative des interactions en streaming multimodal en temps réel avec GPT-4o

WBOY
WBOYoriginal
2024-07-11 15:52:55991parcourir

5 juillet 2024, Shanghai - SenseTime, partenaire stratégique de la Conférence mondiale sur l'intelligence artificielle 2024 et de la Conférence de haut niveau sur la gouvernance mondiale de l'intelligence artificielle (WAIC 2024), a organisé le forum sur l'intelligence artificielle « L'amour sans frontières·Xiang Xinli » et a publié le premier modèle domestique A WYSIWYG est « nouveau chaque jour 5o », et l'expérience interactive est comparée à GPT-4o, réalisant un nouveau modèle d'interaction d'IA. En intégrant des informations multimodales, basées sur diverses formes telles que le son, le texte, l'image et la vidéo, le premier modèle WYSIWYG du pays « Ririxin 5o » apporte un nouveau modèle d'interaction IA, c'est-à-dire une interaction multimodale en streaming en temps réel. Ce modèle d'interaction innovant a également été présenté à tout le monde sur les lieux : le personnel a d'abord dit bonjour à "RiRiXin5o", et il a automatiquement reconnu les mots sur la sangle du badge porté par le personnel et a jugé que la scène était le lieu du monde. Conférence sur l'intelligence artificielle, et a déclaré qu'on peut « bien étudier » dans cet endroit.

Le premier du pays ! SenseTime lance « Ririxin 5o », une évaluation comparative des interactions en streaming multimodal en temps réel avec GPT-4o

Ensuite, le personnel a apporté une jolie poupée chiot, "RiRiXin5o" qui a décrit avec précision l'apparence, l'expression et les vêtements importants du chiot - l'un portant un chapeau blanc avec le logo SenseTime imprimé dessus, très mignon. La foule locale s'est alignée.

Le premier du pays ! SenseTime lance « Ririxin 5o », une évaluation comparative des interactions en streaming multimodal en temps réel avec GPT-4o

Plus difficile, il suffit d'ouvrir n'importe quelle page d'un livre, "RiRiXin5o" peut l'introduire automatiquement. Il ne s'agit pas d'une simple reconnaissance OCR de texte, mais d'une reconnaissance d'images et de textes pour donner un résumé facile à comprendre. peut être complété en un instant, permettant ainsi une véritable interaction en temps réel.

Le premier du pays ! SenseTime lance « Ririxin 5o », une évaluation comparative des interactions en streaming multimodal en temps réel avec GPT-4o

Le personnel a également montré ses "compétences en dessin" sur place et a dessiné un simple petit lapin. "RiRiXin5o" a dit qu'il était mignon, puis le personnel a dessiné une expression souriante. Le sourire s'est capturé. expression, et le personnel a fait un autre changement pour agrandir la bouche et ajouter une langue. Après l'avoir vu, "RiRiXin5o" a immédiatement dit que cette expression était beaucoup plus heureuse.

Vous pouvez écouter, lire et rechercher des sujets, tout comme une vraie personne discutant. Ce mode d'interaction est particulièrement adapté aux applications telles que le dialogue en temps réel et la reconnaissance vocale. Il a une forte adaptabilité multitâche et peut naturellement gérer plusieurs tâches. le même modèle de tâches et ajuste de manière adaptative le comportement et la sortie en fonction de différents contextes. La capacité d'obtenir une expérience interactive comparable à GPT-4o est due à l'amélioration complète des capacités du modèle de base « RiRiXin 5.5 ».

Le « RiRiXin 5.0 » sorti en avril de cette année est le premier modèle national à grande échelle à comparer le GPT-4 Turbo. En un peu plus de deux mois, le nouveau système « RiRiXin 5.5 » a reçu de nombreuses mises à niveau. de 30 % en moyenne par rapport à « Ririxin 5.0 », et le raisonnement mathématique, la capacité en anglais et les capacités de suivi des commandes sont considérablement améliorés. L'effet interactif et les multiples indicateurs de base ont atteint la référence GPT-4o.

Le premier du pays ! SenseTime lance « Ririxin 5o », une évaluation comparative des interactions en streaming multimodal en temps réel avec GPT-4o

« Ririxin 5.5 » adopte une architecture experte de collaboration hybride appareil-cloud pour maximiser la collaboration entre les appareils cloud et réduire les coûts de raisonnement. La formation du modèle est basée sur plus de 10 To de jetons de données de formation de haute qualité, dont une grande quantité. données de chaîne de pensée synthétique, pour améliorer la capacité de réflexion.

Le premier du pays ! SenseTime lance « Ririxin 5o », une évaluation comparative des interactions en streaming multimodal en temps réel avec GPT-4o

Afin de permettre à davantage d'utilisateurs d'entreprise d'accéder et d'utiliser les puissantes capacités du système grand modèle « RiRiXin » à un seuil bas, SenseTime a récemment lancé le plan « Grand modèle 0 Yuan Go ».
  1. Chaque nouvel utilisateur enregistré de "RiRiXin" recevra un ensemble de services gratuits comprenant des appels, une migration, une formation, etc.
  2. Dans le même temps, SenseTime offrira également 50 millions de packages de jetons gratuitement et enverra des consultants en déménagement exclusifs pour aider les utilisateurs d'OpenAI à réaliser une migration sans coût de service.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn