Sky-T1: Le LLM de 450 $ contestant GPT-4O et Deepseek V3-IA-php.cn

Maison

Périphériques technologiques

Sky-T1: Le LLM de 450 $ contestant GPT-4O et Deepseek V3

Jennifer Aniston

Mar 10, 2025 am 10:20 AM

L'équipe Novasky d'UC Berkeley a réalisé un exploit révolutionnaire dans le monde de l'IA, dévoilant Sky-T1-32B-Preview - un modèle de raisonnement remarquablement abordable et entièrement open source. Ce modèle rivalise avec les performances des principaux modèles commerciaux comme GPT-4 et O1, mais son coût de formation était inférieur à 450 $. Cela sape considérablement les budgets de plusieurs millions de dollars généralement associés à un tel développement d'IA avancé.

L'accessibilité de Sky-T1-32B-Preview est son aspect le plus important. L'ensemble du projet - Data, code et poids du modèle - est accessible au public, permettant aux chercheurs, aux universitaires et aux passionnés de contribuer à son amélioration et à la démocratisation de l'IA.

Qu'est-ce qui distingue Sky-T1-32B-Preview?

Contrairement à de nombreux modèles hautement performants dont le fonctionnement interne reste propriétaire, Sky-T1-32B-Preview offre une transparence complète. Ses performances exceptionnelles dans les tâches de raisonnement mathématique et de codage sont particulièrement remarquables.

La création de Sky-T1-32B-Preview:

Sky-T1: The 0 LLM Challenging GPT-4o & DeepSeek V3

Le processus de développement impliquait plusieurs étapes clés:

Curration rigoureuse des données: Une gamme diversifiée d'ensembles de données englobant les mathématiques, le codage, la science et les puzzles ont été méticuleusement collectés et raffinés à l'aide de techniques telles que l'échantillonnage de rejet pour assurer la qualité des données. Reformatation des données a encore renforcé la précision.
Formation efficace: L'équipe a affiné le modèle QWEN-2.5-32B open source à l'aide de leur ensemble de données préparé. Le processus de formation, achevé en seulement 19 heures sur huit GPU haut de gamme, met en évidence l'efficacité de leur approche.
Données de formation équilibrées: Un facteur de réussite clé était l'équilibre minutieux entre les problèmes mathématiques et les problèmes de codage dans les données de formation, permettant au modèle d'exceller dans les deux domaines.

Résultats de référence:

Sky-T1-32B-Preview Les performances sont exceptionnelles dans divers repères:

Mathématiques: a atteint une précision de 82,4% sur MATH500 et 43,3% sur AIME2024, compétitive avec les meilleurs modèles commerciaux.
Codage: a marqué 86,3% sur LivecodeBench-Easy, démontrant la compétence dans les tâches de codage complexes.

Sky-T1: The 0 LLM Challenging GPT-4o & DeepSeek V3

Résultats de clés:

La diversité des données est essentielle: La combinaison équilibrée de données mathématiques et de codage a été essentielle au succès du modèle.
Taille optimale du modèle: Les expériences ont montré qu'un modèle de paramètre 32B était la taille optimale pour atteindre des capacités de raisonnement avancées.

L'avenir du raisonnement open-source:

Sky-T1-32B-Preview représente une étape importante et Novasky prévoit de continuer à affiner l'efficacité et la précision du modèle. Leur engagement envers le développement open source favorise la collaboration et accélère les progrès dans le domaine.

Ressources:

[lien vers le code]
[rapport technique]
[poids du modèle]

Conclusion:

La réalisation de Novasky remet en question le paradigme établi du développement d'IA coûteux et à source fermé. En démontrant que les modèles hautes performances peuvent être créés de manière abordable et ouvertement, ils démocratisent l'accès à la technologie d'IA de pointe et favorisent un environnement de recherche plus inclusif et collaboratif.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article connexe

Le développement du jeu AI entre dans son ère agentique avec le portail de rêveur de bouleversementMay 02, 2025 am 11:17 AM

Jeux de bouleversement: révolutionner le développement de jeux avec les agents de l'IA Les bouleversements, un studio de développement de jeux composé d'anciens combattants de géants de l'industrie comme Blizzard et Obsidian, est sur le point de révolutionner la création de jeux avec son plat innovant alimenté par AI

Uber veut être votre boutique de robotaxi, les fournisseurs les laisseront-ils?May 02, 2025 am 11:16 AM

Stratégie de robotaxi d'Uber: un écosystème de co-hail pour les véhicules autonomes Lors de la récente conférence Curbivore, Richard Willder d'Uber a dévoilé sa stratégie pour devenir la plate-forme de co-hail pour les fournisseurs de robotaxi. Tirant parti de leur position dominante dans

Les agents de l'IA jouant aux jeux vidéo transformeront les futurs robotsMay 02, 2025 am 11:15 AM

Les jeux vidéo s'avèrent être des terrains de test inestimables pour la recherche de pointe de l'IA, en particulier dans le développement d'agents autonomes et de robots du monde réel, contribuant même potentiellement à la quête de l'intelligence générale artificielle (AGI). UN

Le complexe industriel de startup, le VC 3.0 et le manifeste de James CurrierMay 02, 2025 am 11:14 AM

L'impact de l'évolution du paysage du capital-risque est évident dans les médias, les rapports financiers et les conversations quotidiennes. Cependant, les conséquences spécifiques pour les investisseurs, les startups et les fonds sont souvent négligées. Venture Capital 3.0: un paradigme

Adobe met à jour Creative Cloud and Firefly chez Adobe Max London 2025May 02, 2025 am 11:13 AM

Adobe Max London 2025 a fourni des mises à jour importantes au Creative Cloud and Firefly, reflétant un changement stratégique vers l'accessibilité et l'IA générative. Cette analyse intègre des idées à partir d'informations pré-événement avec Adobe Leadership. (Remarque: Adob

Tout ce que Meta a annoncé à LlamaconMay 02, 2025 am 11:12 AM

Les annonces de Llamacon de Meta présentent une stratégie complète d'IA conçue pour rivaliser directement avec des systèmes d'IA fermés comme celles d'OpenAI, tout en créant simultanément de nouveaux flux de revenus pour ses modèles open-source. Cette approche multiforme cible BO

La controverse du brassage sur la proposition que l'IA n'est rien de plus que la technologie normaleMay 02, 2025 am 11:10 AM

Il existe de graves différences dans le domaine de l'intelligence artificielle sur cette conclusion. Certains insistent sur le fait qu'il est temps d'exposer les "nouveaux vêtements de l'empereur", tandis que d'autres s'opposent fortement à l'idée que l'intelligence artificielle n'est que une technologie ordinaire. Discutons-en. Une analyse de cette percée d'IA innovante fait partie de ma colonne Forbes en cours qui couvre les dernières avancées dans le domaine de l'IA, y compris l'identification et l'explication d'une variété de complexités d'influence influentes (cliquez ici pour voir le lien). L'intelligence artificielle en tant que technologie commune Premièrement, certaines connaissances de base sont nécessaires pour jeter les bases de cette discussion importante. Il existe actuellement une grande quantité de recherches dédiées au développement de l'intelligence artificielle. L'objectif global est d'atteindre l'intelligence générale artificielle (AGI) et même la super intelligence artificielle (AS) possible (AS)

Modèles de citoyens, pourquoi la valeur de l'IA est le prochain critère commercialMay 02, 2025 am 11:09 AM

L'efficacité du modèle d'IA d'une entreprise est désormais un indicateur de performance clé. Depuis le boom de l'IA, l'IA générative a été utilisée pour tout, de la composition des invitations d'anniversaire à l'écriture du code logiciel. Cela a conduit à une prolifération du mod de langue

See all articles