Heim >Hardware-Tutorial >Hardware-Neuigkeiten >OpenAI o1 und o1-mini sind KIs, die MINT-Fragen besser bewältigen als frühere Modelle
OpenAI o1 und o1-mini sind da. Diese KI-LLMs schneiden bei Codierungs-, Mathematik- und Naturwissenschaftsproblemen und -aufgaben viel besser ab als frühere Modelle wie GPT-4o, da sie mehr Zeit zum Nachdenken benötigen.
Komplexe Probleme im MINT-Bereich erfordern in der Regel mehr als eine schnelle Online-Suche nach richtigen Antworten. Indem man der o1-KI mehr Zeit zum Nachdenken gibt, kann sie sorgfältiger und genauer schlussfolgern. Das o1-mini-Modell wurde speziell darauf abgestimmt, MINT-Fragen schneller und mit geringerem Bedarf an Computerressourcen zu beantworten, und es ist beim Codieren deutlich besser als das o1-Modell.
Bei einer Reihe standardisierter AP-Prüfungen und MINT-Tests für LLMs erbringen die o1-Modelle eine hohe Genauigkeit. Insbesondere bei den evidenzbasierten Lese- und Schreibtests AP Calculus, AP Chemistry, AP Physics 2, LSAT und SAT erzielen die o1-Modelle eine Leistung auf oder über der B-Klasse (~80 % oder höher). Die Modelle beantworten genau auf dem A-Niveau bei Physikfragen auf PhD-Niveau, auf dem B-Niveau bei schwierigen Mathematikfragen der American Invitational Mathematics Examination 2024 und auf dem hohen B-Niveau bei Codeforces-Codierungsproblemen. Da o1 auf die Beantwortung von MINT-Fragen abgestimmt ist, liegt seine Leistung in den Bereichen AP English Language und AP English Literature auf oder unter dem C-Klasse-Niveau.
Während GPT-4o von der kryptografischen Herausforderung der Dekodierung von „oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz“ verblüfft ist, wenn der Hinweis „oyfjdnisdr rtqwainr acxz mynzbhhx“ „Schritt für Schritt denken“ bedeutet, hatte o1 interessanterweise keine Probleme Denken Sie über das Problem nach, um die richtige Antwort zu finden: „Es gibt drei R in Erdbeere“. Diese neue Macht wird sowohl Hobby-Kryptographen zu Hause als auch die NSA begeistern.
Geheime Übeltäter werden wissen wollen, dass die unzensierten o1-Modelle zwar dazu neigen, beunruhigende Antworten zu geben, OpenAI diese Modelle jedoch für die Veröffentlichung kastriert hat. Die o1-Modelle wurden darauf getestet, Fragen zur Herstellung von Biowaffen, zur Produktion anstößiger Bilder, zum Jailbreak selbst sowie zu Belästigungen und Drohungen nicht zu beantworten. Leider bleiben die OpenAI o1-Modelle trotz Optimierungsbemühungen beim Testen geschlechts- und rassenbezogen.
ChatGPT Plus- und Team-Benutzer sowie Entwickler der API-Nutzungsstufe 5 haben sofort Zugriff auf o1-Modelle, und ChatGPT Edu- und Enterprise-Benutzer erhalten in der Woche vom 16. September Zugriff. ChatGPT Free-Benutzer erhalten Zugriff auf o1- Mini in naher Zukunft. Die o1-Modelle können nicht im Internet surfen oder hochgeladene Dateien und Bilder akzeptieren, um Fragen zu beantworten. Daher empfiehlt OpenAI Benutzern, für allgemeine Fragen weiterhin ihre GPT-4o-Modelle zu verwenden.
Benutzer, die KI-Fragen stellen möchten, können neben denen von OpenAI jetzt auch mit einer breiten Palette leistungsfähiger LLM-Modelle interagieren, darunter Anthropic Claude, Microsoft CoPilot, Google Gemini und X Grok. Jede KI hat spezifische Vorteile, daher lohnt es sich, mehrere KI-Modelle zu testen, um eines zu finden, das den individuellen Bedürfnissen am besten entspricht. Einige dieser KI sind in Datenbrillen (wie diese bei Amazon) und Diktiergeräte (wie dieses bei Amazon) integriert, und einige kommende autonome humanoide Roboter verwenden proprietäre KI zum Kochen und Putzen.
Das obige ist der detaillierte Inhalt vonOpenAI o1 und o1-mini sind KIs, die MINT-Fragen besser bewältigen als frühere Modelle. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!