Maison >Périphériques technologiques >IA >La version bêta interne de Mobvoi explore le modèle à grande échelle « Sequence Monkey » pour créer des produits exclusifs pour les particuliers et les entreprises

La version bêta interne de Mobvoi explore le modèle à grande échelle « Sequence Monkey » pour créer des produits exclusifs pour les particuliers et les entreprises

PHPz
PHPzavant
2023-05-14 12:04:05990parcourir

Le 20 avril, Mobvoi a organisé la conférence stratégique AIGC 2023 à Pékin sur le thème « AGI·Avent ». Lors de la réunion, Mobvoi a annoncé un test interne pour explorer le grand modèle « Sequence Monkey » et a proposé que CoPilot soit partout. En même temps, sur la base des capacités du grand modèle, il a également lancé une matrice de produits CoPilot pour les créateurs et une mise à niveau. version pour la face C. Questions sur la magie des assistants vocaux, ainsi que les tests internes et l'exploration de modèles à grande échelle spécifiques à l'entreprise pour la face B. Parmi eux, la matrice de produits CoPilot pour les créateurs comprend quatre produits AIGC, à savoir la plateforme d'écriture IA « Qiaowen », la plateforme de peinture IA « Yihua », la plateforme de doublage IA « Magic Sound Workshop » et le numérique. plateforme de vidéo humaine et de diffusion en direct "Wonderful Yuan".

La version bêta interne de Mobvoi explore le modèle à grande échelle « Sequence Monkey » pour créer des produits exclusifs pour les particuliers et les entreprises

Grand modèle "Sequence Monkey" auto-développé pour aider AGI à "arriver"

Le grand modèle "Sequence Monkey" de Mobvoi est un grand modèle de langage avec des capacités de génération multimodale. Le système de compétences de base couvre les six dimensions « connaissance, dialogue, mathématiques, logique, raisonnement et planification » et peut prendre en charge simultanément différentes tâches telles que la génération de texte, la génération d'images, la génération de contenu 3D, la génération de parole et la reconnaissance vocale.

À l'heure actuelle, le grand modèle « Sequence Monkey » possède déjà certaines capacités de compréhension, de connaissance, de logique et de raisonnement du langage naturel. Il peut répondre rapidement à des questions complexes telles que « Quelle capitale provinciale a le plus d'habitants, le Hunan ou le Hubei ? » .

Selon les rapports, l'inspiration pour le nom chinois du grand modèle « Sequence Monkey » développé par Mobvoi vient du théorème « Infinite Monkey » proposé par le mathématicien Emile Borel au début du 20e siècle. Selon ce théorème, si un groupe de singes frappait au hasard une machine à écrire, ils finiraient par produire une œuvre complète de Shakespeare. Ce théorème est basé sur la théorie des probabilités et les mathématiques combinatoires et illustre l'unité de la probabilité. Le principe de construction du grand modèle auto-développé par Mobvoi est similaire à celui de "Infinite Monkey". Des séquences de texte massives sont continuellement entraînées par l'algorithme indépendant de Mobvoi et digérées et comprises par une puissance de calcul à grande échelle, et deviennent "Sequence Monkey".

Li Zhifei, fondateur et PDG de Mobvoi, a déclaré que les grands modèles ne concernent pas seulement de grands paramètres. Les grands modèles d'aujourd'hui sont une modélisation approfondie du texte Internet, et le texte Internet est une cartographie des connaissances mondiales, le grand modèle est donc un. modèle cognitif. C’est la modélisation du langage. Le langage est la limite de la pensée, c'est pourquoi les grands modèles laissent une place illimitée à l'imagination. "Sequence Monkey" a démontré sa capacité "émergente" au cours du processus de formation. Il est actuellement au stade "d'éveil" et s'améliorera de plus en plus vite à l'avenir. Il pense également qu'être un CoPilot humain sera le meilleur « travail » pour les grands modèles, et que CoPilot sera partout à l'avenir.

Matrice de produits CoPilot unique, ouvrant l'ensemble du processus de création de contenu

Basé sur le grand modèle "Sequence Monkey", Mobvoi a exploré une variété de produits et d'applications AIGC pour les créateurs lors de tests internes, en construisant pour des milliers de créateurs Matrice de produits CoPilot unique, ouvrant l'ensemble du processus de création de contenu. À l'heure actuelle, Mobvoi a réalisé la « trinité » de la technologie, des produits et de la commercialisation, avec plus de 5 millions d'utilisateurs enregistrés et plus d'un million d'utilisateurs payants dans le monde.

Mobvoi - votre assistant d'écriture IA (write.mobvoi.com)

En tant que premier produit CoPilot dévoilé lors de la conférence de presse, les capacités d'écriture IA de "Mobvoi" couvrent le bureau, le marketing et les nouveaux médias et l'écriture créative, qui peut continuellement fournir aux utilisateurs une inspiration et une direction créative lors de la rédaction de résumés de fin d'année, de mots de service client, de scripts, de rédaction publicitaire et d'autres contenus.

Afin de mieux aider les utilisateurs à améliorer l'efficacité de la création de contenu, « Qiaowen » a ouvert huit fonctions majeures d'édition d'IA, à savoir la transformation de style, l'extraction de points clés, la relecture et la correction d'erreurs, la suite, la réécriture, l'expansion, l'abréviation et la traduction. « Qiaowen » peut également générer automatiquement des images pendant l'écriture, offrant ainsi aux utilisateurs une expérience d'écriture incluant à la fois des images et du texte.

Zhihua - votre assistant de peinture IA (paint.mobvoi.com)

Face aux designers, illustrateurs et autres créateurs qui ont de forts besoins de design en plus du texte, la bêta interne de Mobvoi a exploré la plateforme de peinture IA ""Yihua". "Word Painting" prend en charge 8 styles créatifs, dont le bidimensionnel, le steampunk et l'illustration. Les utilisateurs n'ont qu'à saisir du texte, et « Yihuahua » peut générer simultanément 8 images 2K haute résolution avec une lumière et des ombres réalistes et des détails riches.

En plus d'utiliser du texte pour créer des images, il dispose également de capacités de dessin IA telles que des dessins pour créer des images, la génération d'animations et la génération d'avatars personnalisés, ce qui enrichit considérablement les méthodes créatives des utilisateurs. Pour les utilisateurs d'entreprise, « Yihua » prend également en charge la personnalisation exclusive du modèle, permettant aux utilisateurs d'entreprise de personnaliser le style du modèle en fonction de leurs propres besoins, et prend en charge la production collaborative multi-personnes pour mieux répondre aux besoins de dessin des entreprises.

Actuellement, « Yiyanhua » a atteint une intention d'exploration avec la plateforme de conception de décoration d'intérieur Kujiale. Sur la plateforme Kujiale, les utilisateurs peuvent utiliser « Yiyanhua » pour décrire leurs besoins avec des mots et les modifier facilement. , etc., puis concevez un plan de décoration qui vous plaît.

Moyin Workshop - votre assistant de doublage IA (moyin.com)

Pour les scénarios de doublage IA, Mobvoi a lancé une nouvelle génération de produit de doublage IA "Moyin Workshop". « Magic Sound Workshop » (version étrangère de DupDub) est la principale plate-forme de doublage d'IA à processus complet au monde. Elle a ouvert aux utilisateurs plus de 1 000 timbres, plus de 2 000 styles de voix et plus de 20 dialectes et langues étrangères.

Avec le support de la technologie des grands modèles, "Magic Sound Workshop" est la première plate-forme de doublage au monde équipée de fonctions d'écriture d'IA de grands modèles, couvrant plusieurs scénarios tels que l'écriture, le doublage et l'édition d'IA. Avec son aide, les utilisateurs peuvent facilement réaliser la création de contenu intégrant la rédaction et le doublage, comme des commentaires cinématographiques et télévisés, des livres audio, de l'éducation en ligne et des émissions d'information. À l'heure actuelle, « Magic Sound Workshop » a conclu une coopération avec des entreprises leaders dans de nombreux secteurs tels que WeChat Reading, Juvenile Learning et Volkswagen.

Afin d'offrir aux utilisateurs une meilleure expérience de doublage, "Magic Sound Workshop" prend en charge l'ajustement de 7 émotions, dont calme, triste, heureux, etc. pour des sons sélectionnés, y compris des femmes d'âge moyen, des garçons, etc. 10 types de les caractères ont été migrés et des fonctions d'édition personnalisées du son de l'IA telles que l'ajustement du rythme, le changement de vitesse locale et le doublage à plusieurs personnes ont également été ouvertes, permettant aux utilisateurs d'éditer des sons comme l'édition de documents avec Word.

En plus de la sélection et de l'édition des sons, le « Magic Sound Workshop » lancera également une fonction « pincer le son » basée sur des capacités de génération de langage modèle à grande échelle. Les utilisateurs peuvent sélectionner librement le sexe, l'âge, la langue, le style et l'émotion, etc. caractéristiques sonores, de Créez le son que vous aimez de 0 à 1.

Wonderful Yuan-votre clone numérique de l'IA (weta365.com)

Basé sur les capacités de génération de texte, d'images, de sons, etc., afin de permettre aux créateurs de contenu vidéo de créer plus rapidement et Mieux encore, le test bêta interne de Mobvoi a exploré la plateforme de création d'images numériques et de diffusion en direct d'IA « Wonderful Yuan ».

Selon les rapports, la plateforme « Wonderful Yuan » compte actuellement plus de 100 personnes numériques, plus de 1 000 actifs numériques 3D et plus de 1 000 sons. Grâce à la technologie de génération multimodale, la plate-forme « Wonderful Yuan » prend actuellement en charge trois formes différentes de génération humaine numérique : la modélisation d'images (humain numérique 2D), la modélisation vidéo (humain numérique 2,5D) et la modélisation 3D (humain numérique 3D). Sa fonction de clonage d'image ne nécessite qu'un matériel vidéo en direct de 5 minutes pour reproduire l'image et le comportement de l'utilisateur 1:1, créant ainsi un clone numérique pour l'utilisateur avec une voix cohérente et des mouvements naturels.

Des particuliers aux entreprises, CoPilot sera partout

Mobvoi a une profonde accumulation dans le domaine des assistants vocaux. La recherche sur la voix de l'IA remonte à il y a dix ans. En 2014, Mobvoi a lancé son premier assistant vocal. L'assistant « Xiaowen Assistant » a répété sur « Xiaowen Secretary » en 2015, a lancé un VPA à scénario complet en 2017 et a mis à niveau le VPA en 2019. Après dix ans d'accumulation et de développement, CoPilot-Magic Xiaowen, qui a été exploré lors de tests internes par Mobvoi lors de cette conférence, peut être compris comme une synthèse de Siri et ChatGPT.

"Bonjour, bonjour, où se trouve le restaurant de fondue le plus proche ?", ""Bonjour, pouvez-vous me dire la météo à Pékin demain ?", les gens ont l'habitude de rechercher des informations pertinentes avant d'avoir besoin de nourriture, de vêtements, de logement et transport. En tant que développement pour les utilisateurs individuels Un assistant vocal intelligent, "Magic Xiaowen" peut aider les utilisateurs à vérifier les informations de l'encyclopédie, à vérifier la météo, à vérifier les restaurants et les hôtels, et peut également discuter librement avec les utilisateurs, permettant aux utilisateurs d'obtenir des informations plus facilement et plus facilement. rapidement

Selon Mobvoi, selon l'introduction, "CoPilot" est dérivé du concept de super assistant. Il disposera d'un cerveau à haut QI basé sur un grand modèle, capable d'analyser des données massives et de communiquer avec les humains en réalité. temps et avec précision. Il aura également une belle voix, une belle image et pourra être équipé de n'importe quelle plate-forme matérielle, telle que des téléphones portables, des montres, des machines automobiles, etc. ; -des enseignants de qualité, des avocats compétents, des médecins professionnels, un service client en gestion financière, etc., pour démontrer leurs connaissances professionnelles à tout moment et en tout lieu en cas de besoin

"Sequence Monkey" ouvre l'écosystème et donne du pouvoir à davantage d'industries.

Basé sur les capacités sous-jacentes du grand modèle "Sequence Monkey", pour les utilisateurs B-end et les domaines verticaux, "Mobvoi Copilot" fournit non seulement des services de support de capacités universels et les services de personnalisation d'images humaines numériques ouvriront également leur propre rôle capacités et continuer à itérer les interfaces de données. Les utilisateurs d'entreprise qui en ont besoin peuvent se connecter au Web pour appeler des services API et se former sur du contenu spécifique à leur secteur en téléchargeant des documents pour obtenir une interaction vocale personnalisée. L'URL de Sequence Monkey est openapi.mobvoi.com.

Actuellement, Mobvoi a conclu une coopération avec le premier groupe de partenaires internes d'exploration bêta dans les dix principaux secteurs, notamment l'automobile, l'éducation, les cabinets d'avocats, la finance, les soins médicaux, le tourisme, etc. À l'avenir, Mobvoi « CoPilot » deviendra progressivement responsabiliser davantage d'industries multiples, en aidant davantage d'entreprises à disposer de leurs propres grands modèles exclusifs et à créer leur propre « CoPilot » exclusif.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer