Maison > Article > Périphériques technologiques > Xueersi développe MathGPT, un grand modèle destiné aux passionnés de mathématiques du monde entier
Récemment, Xueersi s'est également joint à la « guerre ChatGPT » qui bat son plein entre les grands fabricants.
Cependant, Xueersi a adopté une approche différente et a choisi le modèle mathématique à grande échelle « MathGPT » qu'il a développé lui-même, qui est basé sur des algorithmes de résolution de problèmes et de cours magistraux dans le domaine des mathématiques, et a déjà obtenu des résultats progressifs.
Xueersi a déclaré que des applications au niveau des produits basées sur ce grand modèle auto-développé devraient être lancées dans le courant de l'année et seront disponibles pour les passionnés de mathématiques et les instituts de recherche scientifique du monde entier.
En tant que projet principal de l'entreprise, Xueersi a lancé la constitution d'équipe, les données, la préparation de la puissance de calcul et la recherche et développement technologique correspondants avant la Fête du Printemps de cette année, et les a directement confiés au CTO Tian Mi.
De plus, la constitution d'équipes dans la Silicon Valley aux États-Unis a également commencé. Elle prévoit de créer une équipe d'algorithmes et d'ingénierie à l'étranger et de recruter des experts exceptionnels en intelligence artificielle du monde entier.
En mars de cette année, OpenAI a officiellement publié le grand modèle de langage GPT-4. Par la suite, Baidu et Alibaba ont également lancé leurs propres produits de grande taille.
Cependant, le modèle linguistique général ressemble davantage à un « étudiant en arts libéraux ». Il a d'excellentes performances dans des tâches telles que la traduction linguistique, la synthèse, la compréhension et la génération, mais présente des lacunes évidentes dans la résolution, l'explication, la réponse et la recommandation de mathématiques. problèmes. ——
"Nous faisons souvent des erreurs lors de la résolution de problèmes de mathématiques. Bien que certains problèmes de mathématiques puissent être résolus, la méthode est plus orientée vers les adultes et ne peut pas être adaptée à la structure des connaissances et au niveau cognitif des enfants du bon âge. ."
À cet égard, le responsable de l'équipe Xueersi AI a déclaré que cette lacune est déterminée par les caractéristiques du modèle LLM. Le grand modèle LLM est issu d'une formation sur des textes linguistiques massifs, il est donc le meilleur en matière de traitement linguistique.
L'industrie préfère utiliser les grands modèles LLM pour les applications de lecture et d'écriture, mais si vous souhaitez faire une percée dans les capacités mathématiques, vous devez développer de nouveaux grands modèles.
Par conséquent, Xueersi est déterminé à former une équipe spécialisée dans MathGPT - un grand modèle dans le domaine des mathématiques. Elle utilisera ses nombreuses années d'accumulation en mathématiques et en IA pour construire un grand modèle d'IA pour les passionnés de mathématiques et les scientifiques. instituts de recherche du monde entier. Les travaux fondamentaux mathématiques de l’époque.
Xueersi espère compenser et surmonter trois problèmes des grands modèles de langage grâce à MathGPT :
Premièrement, les questions doivent être résolues correctement, et maintenant les résultats GPT comportent souvent des erreurs ; pour résoudre les problèmes, il doit être stable et clair. Les étapes actuelles de résolution des problèmes GPT sont différentes à chaque fois, et le contenu généré est souvent redondant.
Troisièmement, la résolution de problèmes doit être intéressante et personnalisée. les explications sont trop « académiques » et les machines, très peu adaptées à l’expérience d’apprentissage des enfants.
Pourquoi faites-vous MathGPT ? Les membres ont de nombreuses années de recherche approfondie dans le domaine de l'intelligence artificielle. Dès 2017, Xueersi a créé le laboratoire d'intelligence artificielle AI Lab.
Récompenses du laboratoire d'IA Xueersi dans diverses conférences et concours universitaires de premier plan
Xueersi, qui a « commencé avec les mathématiques », a 20 ans d'expérience dans l'enseignement des mathématiques et a accumulé une énorme quantité d'expérience en mathématiques. -données liées, ces données sont le matériel nécessaire à la formation MathGPT. De plus, l'entreprise étrangère de Xueersi, Think Academy, est profondément appréciée par les passionnés de mathématiques dans plusieurs pays et régions du monde. Chaque année, les étudiants de Xueersi obtiennent de bons résultats dans les concours internationaux de mathématiques tels que l'OMI et l'AMC. Chaque année, de nombreux étudiants remportent des médailles d'or à l'Olympiade internationale de mathématiques. Il est donc logique que Xueersi choisisse de se concentrer sur MathGPT. Il est également entendu que la machine d'apprentissage Xueersi lancera prochainement un "assistant IA", couvrant les assistants de composition, les assistants parlants, les assistants de lecture, les assistants en mathématiques, etc. . fonction, ce produit d’IA commencera les tests internes le 11 mai. Comment utiliser de grands modèles de langage pour servir tous les horizons est une question centrale dans la société actuelle. Par exemple, dans le domaine de l'éducation, Duolingo, Quizlet, Khan Academy et d'autres produits coopèrent principalement avec OpenAI pour effectuer des réglages fins et des appels d'interface sur le grand GPT modèle pour améliorer l’expérience originale du produit. Mais il existe aussi certains domaines tels que les mathématiques, la médecine, etc., où la demande en IA est la précision, la clarté, de fortes capacités de raisonnement logique et une faible tolérance aux erreurs. .Le LLM général est actuellement La performance n'a pas permis de réaliser des percées dans les domaines ci-dessus, et il n'est pas clair si des percées sont possibles à l'avenir. En prenant comme exemple le domaine des mathématiques, il existe plusieurs grandes écoles sur le marché. Des produits tels que Photomath acquis par Google, Microsoft Mathematics, Mathway et WolframAlpha axés sur les calculs mathématiques utilisent principalement la technologie d'IA traditionnelle non LLM ainsi que des méthodes de base de données pour résoudre les mathématiques. question. Les entreprises empruntant la voie de l'AGI tentent de rendre le LLM général « plus connaisseur en mathématiques ». Par exemple, GPT-4 est plus performant sur les tâches mathématiques que la version précédente 3.5. . Google Son modèle Minerva est également spécialement adapté aux problèmes mathématiques. Xueersi a choisi une autre voie moins fréquentée. Il ne fait pas d'appels de réglage et d'interface basés sur le LLM existant, ni ne fait de LLM à usage général. elle développe son propre MathGPT, le « grand modèle mathématique » dans le domaine professionnel, s'engage à créer des solutions d'apprentissage indépendantes, stables, durables et de qualité. Sous la vague d'évolution continue des grands modèles de langage, les avantages et les inconvénients des différents choix d'itinéraires techniques doivent encore être discutés et vérifiés. Le grand modèle MathGPT indépendant auto-développé par Xueersi est-il établi, s'il peut surpasser les performances des modèles généraux sur les tâches mathématiques et s'il peut mieux correspondre à l'apprentissage mathématique scénarios de différents groupes de personnes, cette question doit encore trouver une réponse dans la pratique de l'innovation. Avec le développement croissant de l'ensemble de l'industrie et de plus en plus de talents participant dans ce domaine, je pense que des solutions plus matures seront vues dans un avenir proche. Défis et problèmes techniques de MathGPT
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!