Singapour publie le modèle arithmétique d'IA Goat, avec des capacités supérieures à GPT-4-IA-php.cn

Maison

Périphériques technologiques

Singapour publie le modèle arithmétique d'IA Goat, avec des capacités supérieures à GPT-4

王林

Jun 07, 2023 pm 05:24 PM

gpt-goat

DoNews a rapporté le 7 juin que la plus grande lacune du modèle GPT-4 actuel est principalement sa capacité arithmétique. Puisque la capacité de raisonnement logique du modèle doit être améliorée, GPT-4 ne peut pas résoudre même ce que beaucoup de gens considèrent comme relativement simple. problèmes de calcul. Résultat correct.

Des chercheurs de l'Université nationale de Singapour ont récemment lancé un modèle appelé Goat, conçu pour résoudre des problèmes arithmétiques. Cette nouvelle a été rapportée par IT House. Les chercheurs ont déclaré qu '"après avoir affiné le modèle LLaMA, Goat a obtenu une précision mathématiquement plus élevée et de meilleures performances que GPT-4".

Singapour publie le modèle arithmétique dIA Goat, avec des capacités supérieures à GPT-4

Les chercheurs ont proposé une nouvelle méthode pour classer les tâches en fonction des types d'arithmétique apprenables, puis utiliser les principes arithmétiques de base pour décomposer les tâches non apprenables en une série de tâches apprenables (IT Home Note : Processus de calcul complexes, décomposez-les en étapes simples) et puis importez le modèle AI.

Cette nouvelle méthode permet au modèle d'apprendre le modèle de réponse et de généraliser le processus à des données invisibles, plutôt que de s'appuyer uniquement sur le pur « calcul de mémoire de poids ». Par conséquent, elle peut améliorer efficacement les performances arithmétiques et peut être utilisée dans l'apprentissage à échantillon nul. La « précision quasi parfaite » génère des réponses pour l'addition et la soustraction de grands nombres.

Les chercheurs se sont entraînés sur un GPU doté de 24 Go de mémoire vidéo et ont testé le modèle final à l'aide de la sous-tâche arithmétique BIG-bench. Les résultats de précision étaient exceptionnels, devant Bloom, GPT-NeoX, OPT et d'autres modèles de l'industrie.

La précision du Goat-7B à échantillon nul a même dépassé le modèle PaLM-540 après un apprentissage sur quelques échantillons, et a largement dépassé le GPT-4 dans un grand nombre de calculs.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration

Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer

Article connexe

L'écart de compétences en IA ralentit les chaînes d'approvisionnementApr 26, 2025 am 11:13 AM

Le terme «main-d'œuvre prêt pour l'IA» est fréquemment utilisé, mais qu'est-ce que cela signifie vraiment dans l'industrie de la chaîne d'approvisionnement? Selon Abe Eshkenazi, PDG de l'Association for Supply Chain Management (ASCM), il signifie des professionnels capables de critique

Comment une entreprise travaille tranquillement pour transformer l'IA pour toujoursApr 26, 2025 am 11:12 AM

La révolution de l'IA décentralisée prend tranquillement de l'ampleur. Ce vendredi à Austin, au Texas, le Sommet de fin de partie Bittensor marque un moment pivot, en transition de l'IA décentralisée (DEAI) de la théorie à l'application pratique. Contrairement à la publicité fastueuse

NVIDIA publie des microservices NEMO pour rationaliser le développement des agents AIApr 26, 2025 am 11:11 AM

L'IA de l'entreprise fait face à des défis d'intégration des données L'application de l'IA de l'entreprise est confrontée à un défi majeur: la construction de systèmes qui peuvent maintenir la précision et la pratique en apprenant continuellement les données commerciales. Les microservices NEMO résolvent ce problème en créant ce que NVIDIA décrit comme "Data Flywheel", permettant aux systèmes d'IA de rester pertinents par une exposition continue aux informations de l'entreprise et à l'interaction des utilisateurs. Cette boîte à outils nouvellement lancée contient cinq microservices clés: NEMO Customizer gère le réglage fin des modèles de grands langues avec un débit de formation plus élevé. L'évaluateur NEMO fournit une évaluation simplifiée des modèles d'IA pour les repères personnalisés. NEMO Guar-Rails met en œuvre des contrôles de sécurité pour maintenir la conformité et la pertinence

L'IA dépeint une nouvelle image pour l'avenir de l'art et du designApr 26, 2025 am 11:10 AM

AI: L'avenir de l'art et du design L'intelligence artificielle (IA) modifie le domaine de l'art et de la conception de manière sans précédent, et son impact ne se limite plus aux amateurs, mais affectant plus profondément les professionnels. Les schémas d'œuvres d'art et de conception générés par l'IA remplacent rapidement les images et les concepteurs de matériaux traditionnels dans de nombreuses activités de conception transactionnelles telles que la publicité, la génération d'images des médias sociaux et la conception Web. Cependant, les artistes et designers professionnels trouvent également la valeur pratique de l'IA. Ils utilisent l'IA comme outil auxiliaire pour explorer de nouvelles possibilités esthétiques, mélanger différents styles et créer de nouveaux effets visuels. L'IA aide les artistes et les concepteurs à automatiser les tâches répétitives, à proposer différents éléments de conception et à fournir une contribution créative. L'IA prend en charge le transfert de style, qui doit appliquer un style d'image

Comment le zoom révolutionne le travail avec l'agent AI: des réunions aux jalonsApr 26, 2025 am 11:09 AM

Zoom, initialement connu pour sa plate-forme de vidéoconférence, dirige une révolution en milieu de travail avec son utilisation innovante de l'IA agentique. Une conversation récente avec le CTO de Zoom, XD Huang, a révélé la vision ambitieuse de l'entreprise. Définition de l'IA agentique Huang D

La menace existentielle pour les universitésApr 26, 2025 am 11:08 AM

L'IA va-t-elle révolutionner l'éducation? Cette question provoque une réflexion sérieuse entre les éducateurs et les parties prenantes. L'intégration de l'IA dans l'éducation présente à la fois des opportunités et des défis. Comme le note Matthew Lynch de The Tech Edvocate, Universit

Le prototype: les scientifiques américains recherchent des emplois à l'étrangerApr 26, 2025 am 11:07 AM

Le développement de la recherche scientifique et de la technologie aux États-Unis peut faire face à des défis, peut-être en raison de coupes budgétaires. Selon la nature, le nombre de scientifiques américains postulant pour des emplois à l'étranger a augmenté de 32% de janvier à mars 2025 par rapport à la même période en 2024. Un sondage précédent a montré que 75% des chercheurs interrogés envisageaient de rechercher des emplois en Europe et au Canada. Des centaines de subventions NIH et NSF ont été licenciées au cours des derniers mois, avec les nouvelles subventions du NIH d'environ 2,3 milliards de dollars cette année, une baisse de près d'un tiers. Le projet de budget divulgué montre que l'administration Trump envisage de réduire fortement les budgets pour les institutions scientifiques, avec une réduction possible allant jusqu'à 50%. La tourmente dans le domaine de la recherche fondamentale a également affecté l'un des principaux avantages des États-Unis: attirer des talents à l'étranger. 35

Tout sur la dernière famille GPT 4.1 d'Open AI - Analytics VidhyaApr 26, 2025 am 10:19 AM

OpenAI dévoile la puissante série GPT-4.1: une famille de trois modèles de langage avancé conçus pour des applications réelles. Ce saut significatif en avant offre des temps de réponse plus rapides, une compréhension améliorée et des coûts considérablement réduits par rapport à T

See all articles

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Afficher plus

Article chaud

Assassin's Creed Shadows: Solution d'énigmes de coquille

4 Il y a quelques semainesByDDD

Quoi de neuf dans Windows 11 KB5054979 et comment résoudre les problèmes de mise à jour

3 Il y a quelques semainesByDDD

Où trouver la courte de la grue à atomide atomique

4 Il y a quelques semainesByDDD

<🎜>: Dead Rails - Comment relever chaque défi

1 Il y a quelques moisByDDD

Comment réparer KB5055523 ne parvient pas à s'installer dans Windows 11?

2 Il y a quelques semainesByDDD

Afficher plus

Outils chauds

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

MinGW - GNU minimaliste pour Windows

Ce projet est en cours de migration vers osdn.net/projects/mingw, vous pouvez continuer à nous suivre là-bas. MinGW : un port Windows natif de GNU Compiler Collection (GCC), des bibliothèques d'importation et des fichiers d'en-tête librement distribuables pour la création d'applications Windows natives ; inclut des extensions du runtime MSVC pour prendre en charge la fonctionnalité C99. Tous les logiciels MinGW peuvent fonctionner sur les plates-formes Windows 64 bits.