Xueersi développe MathGPT, un grand modèle destiné aux passionnés de mathématiques du monde entier-IA-php.cn

Maison

Périphériques technologiques

Xueersi développe MathGPT, un grand modèle destiné aux passionnés de mathématiques du monde entier

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 11, 2023 pm 09:55 PM

ai研发

Récemment, Xueersi s'est également joint à la « guerre ChatGPT » qui bat son plein entre les grands fabricants.

Cependant, Xueersi a adopté une approche différente et a choisi le modèle mathématique à grande échelle « MathGPT » qu'il a développé lui-même, qui est basé sur des algorithmes de résolution de problèmes et de cours magistraux dans le domaine des mathématiques, et a déjà obtenu des résultats progressifs.

Xueersi a déclaré que des applications au niveau des produits basées sur ce grand modèle auto-développé devraient être lancées dans le courant de l'année et seront disponibles pour les passionnés de mathématiques et les instituts de recherche scientifique du monde entier.

En tant que projet principal de l'entreprise, Xueersi a lancé la constitution d'équipe, les données, la préparation de la puissance de calcul et la recherche et développement technologique correspondants avant la Fête du Printemps de cette année, et les a directement confiés au CTO Tian Mi.

De plus, la constitution d'équipes dans la Silicon Valley aux États-Unis a également commencé. Elle prévoit de créer une équipe d'algorithmes et d'ingénierie à l'étranger et de recruter des experts exceptionnels en intelligence artificielle du monde entier.

La différence entre MathGPT et le grand modèle de langage (LLM)

En mars de cette année, OpenAI a officiellement publié le grand modèle de langage GPT-4. Par la suite, Baidu et Alibaba ont également lancé leurs propres produits de grande taille.

Cependant, le modèle linguistique général ressemble davantage à un « étudiant en arts libéraux ». Il a d'excellentes performances dans des tâches telles que la traduction linguistique, la synthèse, la compréhension et la génération, mais présente des lacunes évidentes dans la résolution, l'explication, la réponse et la recommandation de mathématiques. problèmes. ——

"Nous faisons souvent des erreurs lors de la résolution de problèmes de mathématiques. Bien que certains problèmes de mathématiques puissent être résolus, la méthode est plus orientée vers les adultes et ne peut pas être adaptée à la structure des connaissances et au niveau cognitif des enfants du bon âge. ."

À cet égard, le responsable de l'équipe Xueersi AI a déclaré que cette lacune est déterminée par les caractéristiques du modèle LLM. Le grand modèle LLM est issu d'une formation sur des textes linguistiques massifs, il est donc le meilleur en matière de traitement linguistique.

L'industrie préfère utiliser les grands modèles LLM pour les applications de lecture et d'écriture, mais si vous souhaitez faire une percée dans les capacités mathématiques, vous devez développer de nouveaux grands modèles.

Par conséquent, Xueersi est déterminé à former une équipe spécialisée dans MathGPT - un grand modèle dans le domaine des mathématiques. Elle utilisera ses nombreuses années d'accumulation en mathématiques et en IA pour construire un grand modèle d'IA pour les passionnés de mathématiques et les scientifiques. instituts de recherche du monde entier. Les travaux fondamentaux mathématiques de l’époque.

Xueersi espère compenser et surmonter trois problèmes des grands modèles de langage grâce à MathGPT :

Premièrement, les questions doivent être résolues correctement, et maintenant les résultats GPT comportent souvent des erreurs ; pour résoudre les problèmes, il doit être stable et clair. Les étapes actuelles de résolution des problèmes GPT sont différentes à chaque fois, et le contenu généré est souvent redondant.

Troisièmement, la résolution de problèmes doit être intéressante et personnalisée. les explications sont trop « académiques » et les machines, très peu adaptées à l’expérience d’apprentissage des enfants.

Pourquoi faites-vous MathGPT ? Les membres ont de nombreuses années de recherche approfondie dans le domaine de l'intelligence artificielle. Dès 2017, Xueersi a créé le laboratoire d'intelligence artificielle AI Lab.

Selon des informations publiques, grâce à l'aide de la plateforme d'innovation ouverte d'intelligence artificielle pour l'éducation intelligente, le laboratoire d'IA Xueersi a remporté 16 championnats et 6 finalistes dans diverses compétitions de conférences universitaires de haut niveau et a publié 31 articles universitaires de haut niveau ; des revues et conférences internationales, y compris des recherches universitaires dans de multiples domaines tels que la reconnaissance optique de caractères, les images, le traitement du langage naturel, la parole et la multimodalité, etc., ont publié de nombreux articles dans les meilleures conférences sur la vision par ordinateur et dans les meilleures conférences sur le langage naturel ; plus de 220 brevets et brevets autorisés Plus de 150 articles et plus de 60 droits d'auteur sur les logiciels.

Récompenses du laboratoire d'IA Xueersi dans diverses conférences et concours universitaires de premier plan

Xueersi développe MathGPT, un grand modèle destiné aux passionnés de mathématiques du monde entier

Xueersi, qui a « commencé avec les mathématiques », a 20 ans d'expérience dans l'enseignement des mathématiques et a accumulé une énorme quantité d'expérience en mathématiques. -données liées, ces données sont le matériel nécessaire à la formation MathGPT.

De plus, l'entreprise étrangère de Xueersi, Think Academy, est profondément appréciée par les passionnés de mathématiques dans plusieurs pays et régions du monde. Chaque année, les étudiants de Xueersi obtiennent de bons résultats dans les concours internationaux de mathématiques tels que l'OMI et l'AMC. Chaque année, de nombreux étudiants remportent des médailles d'or à l'Olympiade internationale de mathématiques.

Il est donc logique que Xueersi choisisse de se concentrer sur MathGPT.

Il est également entendu que la machine d'apprentissage Xueersi lancera prochainement un "assistant IA", couvrant les assistants de composition, les assistants parlants, les assistants de lecture, les assistants en mathématiques, etc. . fonction, ce produit d’IA commencera les tests internes le 11 mai.

Défis et problèmes techniques de MathGPT

Comment utiliser de grands modèles de langage pour servir tous les horizons est une question centrale dans la société actuelle.

Par exemple, dans le domaine de l'éducation, Duolingo, Quizlet, Khan Academy et d'autres produits coopèrent principalement avec OpenAI pour effectuer des réglages fins et des appels d'interface sur le grand GPT modèle pour améliorer l’expérience originale du produit.

Mais il existe aussi certains domaines tels que les mathématiques, la médecine, etc., où la demande en IA est la précision, la clarté, de fortes capacités de raisonnement logique et une faible tolérance aux erreurs. .Le LLM général est actuellement La performance n'a pas permis de réaliser des percées dans les domaines ci-dessus, et il n'est pas clair si des percées sont possibles à l'avenir.

En prenant comme exemple le domaine des mathématiques, il existe plusieurs grandes écoles sur le marché.

Des produits tels que Photomath acquis par Google, Microsoft Mathematics, Mathway et WolframAlpha axés sur les calculs mathématiques utilisent principalement la technologie d'IA traditionnelle non LLM ainsi que des méthodes de base de données pour résoudre les mathématiques. question.

Les entreprises empruntant la voie de l'AGI tentent de rendre le LLM général « plus connaisseur en mathématiques ». Par exemple, GPT-4 est plus performant sur les tâches mathématiques que la version précédente 3.5. . Google Son modèle Minerva est également spécialement adapté aux problèmes mathématiques.

Xueersi a choisi une autre voie moins fréquentée. Il ne fait pas d'appels de réglage et d'interface basés sur le LLM existant, ni ne fait de LLM à usage général. elle développe son propre MathGPT, le « grand modèle mathématique » dans le domaine professionnel, s'engage à créer des solutions d'apprentissage indépendantes, stables, durables et de qualité.

Sous la vague d'évolution continue des grands modèles de langage, les avantages et les inconvénients des différents choix d'itinéraires techniques doivent encore être discutés et vérifiés.

Le grand modèle MathGPT indépendant auto-développé par Xueersi est-il établi, s'il peut surpasser les performances des modèles généraux sur les tâches mathématiques et s'il peut mieux correspondre à l'apprentissage mathématique scénarios de différents groupes de personnes, cette question doit encore trouver une réponse dans la pratique de l'innovation.

Avec le développement croissant de l'ensemble de l'industrie et de plus en plus de talents participant dans ce domaine, je pense que des solutions plus matures seront vues dans un avenir proche.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration

Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer

Article connexe

Évitez ces 5 erreurs courantes dans l'IA que chaque novice faitApr 18, 2025 am 11:25 AM

Vous lancez dans votre voyage d'IA? Évitez ces pièges courants! Ce guide met en évidence cinq erreurs fréquentes les débutants font et propose des solutions pour une expérience d'apprentissage plus fluide et plus réussie. Les principaux plats à retenir: Master les fondamentaux de l'IA avant le plateau

Tech avec respect: IA et puissance communautaire autochtoneApr 18, 2025 am 11:21 AM

La réponse est complexe. L'IA a un énorme potentiel pour soutenir l'autodétermination indigène, la préservation des langues et la gestion du climat. Mais il risque également d'approfondir les modèles d'effacement, d'exploitation et d'exclusion de longue date - à moins que ce ne soit

Impact des agents d'IA virtuels sur les expériences de produits numériquesApr 18, 2025 am 11:13 AM

Révolutionner le service client: l'essor des agents d'IA virtuels dans les systèmes d'information intégrés Dans le paysage numérique en évolution rapide d'aujourd'hui, les entreprises recherchent constamment des moyens innovants pour améliorer la communication client. L'intégration de

Google Guilty Again, Meta on Trial, Openai Social, IR se retrouvent Touchcast AIApr 18, 2025 am 11:10 AM

Le 17 avril 2025, le juge de district américain Leonie Brinkema a jugé que Google a monopolisé illégalement les segments clés du marché de la publicité numérique. Le tribunal a déterminé que Google avait abusé de sa domination en liant son serveur publicitaire d'éditeur et son échange d'annonces,

AV Bytes: Innovations hebdomadaires d'IA avec SearchGpt, Llama 3.1 et plusApr 18, 2025 am 11:06 AM

Une percée majeure dans le domaine de l'IA cette semaine! AV Bytes vous apporte les derniers progrès dans le domaine de l'IA, et l'excitation n'est pas manquée! L'avenir des moteurs de recherche? Searchgpt d'Openai, Meta's Llama 3.1 et le grand modèle 2 de Mistral Ai Poussent tous l'IA vers de nouveaux sommets. De plus, l'IA a remporté des médailles dans l'Olympiade des mathématiques et a montré un potentiel au-delà des médecins humains dans le domaine du diagnostic médical. Tout cela indique que la science-fiction devient progressivement une réalité! Faits saillants de la semaine: SearchGPT d'OpenAI: Un nouveau prototype de moteur de recherche qui utilise une technologie de traitement avancée du langage naturel pour améliorer l'efficacité de la récupération des informations. Meta's Llama 3.1: Embrace

Quelle est la chaîne de densité dans l'ingénierie rapide? - Analytique VidhyaApr 18, 2025 am 11:04 AM

Maîtrisez la chaîne de densité en ingénierie rapide: créez des invites concises et efficaces Dans le traitement du langage naturel (PNL) et l'intelligence artificielle, la maîtrise de l'ingénierie rapide est devenue cruciale. Cette compétence combine la science et l'art, et il s'agit de concevoir soigneusement des instructions précises pour guider les modèles d'IA pour générer les résultats souhaités. Parmi les nombreuses technologies, la chaîne de densité se distingue comme un moyen puissant de créer des conseils concis et efficaces. Cet article explore profondément le concept, l'application des chaînes de densité dans l'ingénierie des conseils et leur signification dans la création de contenu axée sur l'IA. Aperçu Les conseils sur les méthodes de chaîne de densité en ingénierie sont cruciaux dans la PNL et l'IA. Améliore itérativement un large éventail de résumé en compressant et en ajoutant des informations pertinentes.

API ElevenLabs: un guide de la synthèse vocale, du clonage et plusApr 18, 2025 am 10:59 AM

Elevenlabs: révolutionner la synthèse vocale avec l'IA Transformez le texte en voix captivantes sans effort avec les solutions de synthèse et audio de la voix de pointe des Elevenlabs. Ce guide explore les caractéristiques clés d'ElevenLabs, fournit une démo API pratique

Construire une recherche efficace de similitude d'image avec VGG16 et FAISApr 18, 2025 am 10:56 AM

Récupération rapide de l'image: construire un système de recherche de similitude à grande vitesse avec VGG16 et FAIS Imaginez la frustration de rechercher manuellement d'innombrables photos pour trouver une image spécifique. Cet article explore une solution: construire un coup de foudre

See all articles