Maison >Tutoriel matériel >Actualités matérielles >OpenAI o1 et o1-mini arrivent en tant qu'IA qui gèrent mieux les questions STEM que les modèles précédents

OpenAI o1 et o1-mini arrivent en tant qu'IA qui gèrent mieux les questions STEM que les modèles précédents

DDDoriginal: 2024-09-19 03:22:03965parcourir

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 et o1-mini sont arrivés. Ces LLM d'IA fonctionnent bien mieux sur les problèmes et tâches de codage, de mathématiques et de sciences que les modèles précédents tels que GPT-4o en prenant plus de temps de réflexion.

Les problèmes complexes dans les domaines STEM nécessitent généralement plus qu'une recherche rapide en ligne pour trouver les bonnes réponses. En donnant à l’IA o1 plus de temps pour réfléchir, elle peut raisonner avec plus de soin et de précision. Le modèle o1-mini a été spécialement conçu pour répondre aux questions STEM avec une vitesse plus rapide et une moindre demande en ressources informatiques, et il est nettement meilleur en matière de codage que le modèle o1.

Dans une gamme d'examens AP standardisés et de tests STEM pour les LLM, les modèles o1 fonctionnent avec une grande précision. Plus précisément, dans les tests de lecture et d'écriture fondés sur des preuves AP Calculus, AP Chemistry, AP Physics 2, LSAT et SAT, les modèles o1 fonctionnent au niveau B ou au-dessus (~ 80 % ou plus). Les modèles répondent avec précision au niveau A aux questions de physique de niveau doctorat, au niveau B aux questions mathématiques difficiles de l'American Invitational Mathematics Examination 2024 et au niveau B élevé sur les problèmes de codage Codeforces. Étant donné que o1 a été conçu pour répondre aux questions STEM, ses performances en langue anglaise AP et en littérature anglaise AP sont égales ou inférieures au niveau C.

Fait intéressant, alors que GPT-4o est abasourdi par le défi cryptographique du décodage de « oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz » lorsqu'on lui donne l'indice « oyfjdnisdr rtqwainr acxz mynzbhhx » signifie « Pensez étape par étape », o1 n'a eu aucun problème. réfléchir au problème pour trouver la bonne réponse « Il y a trois r dans la fraise ». Ce nouveau pouvoir ravira les cryptographes amateurs chez eux ainsi que la NSA.

Les malfaiteurs du placard voudront savoir que même si les modèles o1 non censurés sont susceptibles de donner des réponses troublantes, OpenAI a stérilisé ces modèles pour leur publication. Les modèles o1 ont été testés pour résister aux questions sur la fabrication d'armes biologiques, la production d'images coquines, le jailbreak, le harcèlement et les menaces. Malheureusement, les modèles OpenAI o1 restent biaisés en fonction du sexe et de la race lorsqu'ils sont testés, malgré les efforts de réglage.

Les utilisateurs de ChatGPT Plus et Team ainsi que les développeurs de niveau 5 d'utilisation de l'API ont immédiatement accès aux modèles o1, et les utilisateurs de ChatGPT Edu et Enterprise y auront accès la semaine du 16 septembre. Les utilisateurs de ChatGPT Free auront accès à o1- mini dans un futur proche. Les modèles o1 ne peuvent pas naviguer sur le Web ni accepter de fichiers et d'images téléchargés pour répondre aux questions. OpenAI recommande donc aux utilisateurs de continuer à utiliser leurs modèles GPT-4o pour les questions générales.

Les utilisateurs qui souhaitent poser des questions sur l'IA disposent désormais d'un large éventail de modèles LLM performants avec lesquels interagir en plus de ceux d'OpenAI, notamment Anthropic Claude, Microsoft CoPilot, Google Gemini et X Grok. Chaque IA présente des avantages spécifiques, il vaut donc la peine de tester plusieurs modèles d’IA pour trouver celui qui répond le mieux aux besoins individuels. Certaines de ces IA sont intégrées à des lunettes intelligentes (comme celles-ci sur Amazon) et à des enregistreurs vocaux (comme celui-ci sur Amazon), et certains robots humanoïdes autonomes à venir utilisent une IA propriétaire pour cuisiner et nettoyer.

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

for while require math continue using this chatgpt microsoft gpt copilot Access

Déclaration：

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article précédent：La fuite de la batterie du Samsung Galaxy S25 ne suggère aucune amélioration de la capacitéArticle suivant：La fuite de la batterie du Samsung Galaxy S25 ne suggère aucune amélioration de la capacité

Articles Liés

Voir plus