


Hast du die großen Neuigkeiten gehört? OpenAI hat gerade eine Vorschau einer neuen Reihe von AI -Modellen eingeführt - OpenAI O1 (auch als Projekt Strawberry/Q*bekannt). Diese Modelle sind etwas Besonderes, weil sie mehr Zeit damit verbringen, zu denken, bevor sie Ihnen eine Antwort geben. Das bedeutet, dass sie besser in Bereichen wie Wissenschaft, Codierung und Mathematik im Vergleich zu früheren Modellen besser angehen können, vor allem dank der fortgeschrittenen OpenAI O1 -Parameter .
Openai nimmt das Motto „Denken Sie vor dem Sprechen“ mit der O1 -Serie!
Überblick
- OpenAIs neue O1 -Modellreihe zeichnet sich durch schwierige Probleme in Mathematik, Naturwissenschaften und Codierung aus und überstreicht frühere Versionen.
- Das O1-Präview-Modell befasst sich mit fortgeschrittenen Aufgaben, löst 93% der Mathematikprobleme von Aime und übertrifft menschliche Experten in wissenschaftlichen Benchmarks. Ein Großteil dieses Erfolgs hängt davon ab, wie effektiv geöffnete O1 -Parameter für komplexe Aufgaben eingestellt sind.
- O1-Mini von OpenAI bietet leistungsstarke Codierungsfunktionen zu 80% der Kosten und macht es zu einem zugänglichen Tool für Entwickler.
- Mit verbesserten Sicherheitsmaßnahmen gewährleisten die O1-Modelle den verantwortungsbewussten KI-Gebrauch und bieten Forschern, Entwicklern und Pädagogen eine verbesserte Problemlösung.
Inhaltsverzeichnis
- Was ist die große Sache?
- Anwendungsfälle von OpenAI O1
- Beeindruckende Testergebnisse
- Fortgeschrittene Mathematikwettbewerbe
- Wissenschaftskompetenz
- Codierung
- Andere Benchmarks und visuelles Verständnis
- Treffen Sie O1-Mini
- Mathematik mit O1 Mini
- Wer kann O1-Präview verwenden?
- Wie greife ich auf O1-Präview?
- Sicherheit ist auch wichtig
- Was kommt als nächstes?
- Letzte Gedanken
Was ist die große Sache?
Die O1-Präview-Modelle sind geschult, um einen Schritt zurückzutreten und die Dinge wirklich durchzudenken, ähnlich wie ein Mensch, wenn sie mit einem schwierigen Problem konfrontiert sind. Sie berücksichtigen unterschiedliche Ansätze, verfeinern ihre Gedanken und fangen sogar ihre eigenen Fehler auf dem Weg. Diese tiefere Denkstufe ermöglicht es ihnen, Probleme zu lösen, mit denen ältere Modelle nicht umgehen konnten.
Anwendungsfälle von OpenAI O1
Codierung mit OpenAI O1
Rätsel mit Openai O1 schreiben
HTML -Schlange mit OpenAI O1
Beeindruckende Testergebnisse
Um zu sehen, wie viel besser O1 mit dem früheren GPT-4O-Modell verglichen wird, hat Openai sie durch eine Reihe schwieriger Tests, einschließlich menschlicher Prüfungen und Benchmarks für maschinelles Lernen, durchgesetzt. Und raten Sie mal, was? O1 übertraf GPT-4O bei den meisten dieser argumentierenden Aufgaben!
Lassen Sie uns einige der Ergebnisse aufschlüsseln:
Fortgeschrittene Mathematikwettbewerbe
Sie testeten die Modelle auf der Aime (American Invitational Mathematics Examination) , eine super herausfordernde Mathematikprüfung für Top -Schüler in den USA
- GPT-4O : etwa 12% der Probleme gelöst (ungefähr 1,8 von 15 Fragen).
- OpenAI O1 : 74% mit nur einem Versuch pro Problem gelöst (ca. 11,1 von 15). Wenn sie das Modell mehrmals ausprobieren und die häufigste Antwort nahmen, erzielte es 83% . Mit noch fortgeschritteneren Methoden erreichte es 93% und löste ungefähr 13,9 von 15 Problemen!
Um dies ins rechte Licht zu rücken, würde eine Punktzahl von 13,9 O1 in den Top 500 Studenten auf nationaler und über dem Grenzwert für die mathematische US -Olympiade in den USA bringen. Das ist eine ernsthafte Gehirnleistung!
Wissenschaftskompetenz
Sie bewerteten O1 auch auf GPQA-Diamond , einem schwierigen Benchmark, der Kenntnisse in Chemie, Physik und Biologie testet. Openai brachte sogar Experten mit Doktoranden mit, um diese Fragen zu beantworten.
- Ergebnis : O1 übertraf diese menschlichen Experten und wurde das erste KI -Modell, das dies auf diesem Benchmark tut! Dies zeigt, dass O1 komplexe wissenschaftliche Probleme auf einem sehr hohen Niveau lösen kann.
Codierung
Bei Codierungswettbewerben wie Codeforces erreichten die neuen Modelle das 89. Perzentil und zeigten, dass sie einen komplexen Code problemlos generieren und debuggen können.
Andere Benchmarks und visuelles Verständnis
Aber das ist nicht alles! Das O1 -Modell zeigte auch signifikante Verbesserungen in anderen Bereichen:
Visuelle Informationen verstehen (Vision Wahrnehmung)
Das O1 -Modell kann nun Bilder interpretieren und verstehen - eine Fähigkeit, die als Visionswahrnehmung bekannt ist. Dies bedeutet, dass es visuelle Daten analysieren und Fragen dazu beantworten kann. Dies ist ein großer Fortschritt für die KI.
Medizinischer Bildgebungstest (MMMU Benchmark)
OpenAI testete O1 auf einem herausfordernden Benchmark namens MMMU (das für das Verständnis für multimodale medizinische Maschine steht). In diesem Test wird bewertet, wie gut eine KI medizinische Bilder verstehen und genaue Bewertungen vornehmen kann, ähnlich wie bei Aufgaben, die von medizinischen Fachkräften ausgeführt werden.
Ergebnis : O1 erzielte bei diesem Test 78,2% und machte es zum ersten KI -Modell, das auf einer Ebene mit menschlichen Experten in der medizinischen Bildgebung vergleichbar ist. Dies ist riesig, weil das Verständnis und die Interpretation von medizinischen Bildern tiefes Wissen und Präzision erfordert.
Breites Wissensbereich (MMLU -Benchmark)
Das O1 -Modell wurde auch an der MMLU -Benchmark (massive Multitasking Language -Verständnis) getestet, die 57 verschiedene Fächer von Geschichte und Literatur bis hin zu Mathematik und Informatik abdeckt.
Ergebnis : O1 übertraf GPT-4O in 54 von 57 Probanden! Dies zeigt, dass O1 nicht nur auf einen Bereich spezialisiert ist, sondern ein verbessertes Verständnis für ein breites Spektrum von Themen.
In einfacherer Hinsicht bedeutet die Fähigkeit von O1, sowohl Text als auch Bilder zu verstehen, vielseitiger und fähiger. Unabhängig davon, ob es sich um komplexe medizinische Bilder, die Lösung fortschrittlicher Mathematikprobleme oder die Beantwortung von Fragen in verschiedenen Probanden handelt, O1 setzt neue Standards für die KI fest.
Treffen Sie O1-Mini
OpenAI hat auch O1-Mini eingeführt, eine kleinere, schnellere und erschwinglichere Version des O1-Präview-Modells, das besonders gut in Codierungsaufgaben ist. Es ist 80% billiger und macht es zu einer großartigen Option für Entwickler, die leistungsstarke Argumentationsfähigkeiten benötigen, ohne die Bank zu brechen.
Wir veröffentlichen auch OpenAI O1-Mini, ein kostengünstiges Argumentationsmodell, das sich bei STEM, insbesondere bei Mathematik und Codierung
- Openai (@openai) 12. September 2024
Mathematik mit O1 Mini
Lesen Sie auch: Openais O1-Mini: Ein bahnbrechendes Modell für MINT mit kostengünstigen Argumentation
Wer kann O1-Präview verwenden?
Diese neuen Modelle sind ein Spielveränderer für alle, die sich mit komplexen Problemen befassen:
- Forscher und Wissenschaftler : Sie können die Zellsequenzierungsdaten helfen oder komplexe Formeln erzeugen, die in Bereichen wie der Quantenphysik benötigt werden.
- Entwickler : Das Erstellen und Ausführen von mehrstufigen Workflows wird einfacher und effizienter.
- Studenten und Pädagogen : Sie bieten eine neue Möglichkeit, herausfordernde Konzepte in Mathematik und Naturwissenschaften zu untersuchen.
Wie greife ich auf O1-Präview?
Chatgpt Plus- und Teambenutzer : Sie können ab heute auf die Modelle O1-Präview- und O1-Mini-Modelle in Chatgpt zugreifen. Wählen Sie sie einfach aus dem Modellpicker aus. Es gibt wöchentliche Nachrichtenlimits für den Moment (30 Nachrichten für O1-Präview und 50 für O1-Mini), aber OpenAI arbeitet daran, diese Grenzen bald zu erhöhen.
- Chatgpt Enterprise und EDU -Benutzer : Sie erhalten ab nächster Woche Zugriff auf beide Modelle.
- Entwickler : Wenn Sie in der API -Nutzungsstufe 5 sind, können Sie heute über die API mit diesen Modellen experimentieren. Einige Funktionen wie Funktionsaufruf und Streaming sind noch nicht verfügbar, aber sie sind unterwegs.
- Chatgpt kostenlose Benutzer : Tolle Neuigkeiten! OpenAI plant, bald O1-Mini für alle kostenlosen Benutzer zur Verfügung zu stellen.
Sicherheit ist auch wichtig
OpenAI hat auch die Sicherheitsmerkmale mit diesen Modellen verstärkt. Sie wurden geschult, um Sicherheitsrichtlinien besser zu verstehen und zu befolgen, indem sie während der Gespräche über die Regeln argumentieren. Dies bedeutet, dass sie weniger wahrscheinlich dazu gebracht werden, etwas zu tun, was sie nicht tun sollten (vielleicht haben Sie von „Jailbreaking“ -Ai -Modellen gehört).
In schwierigen Sicherheitstests erzielte das O1-Präview-Modell im Vergleich zu GPT-4O-Punktzahl von 22 84 von 100 . Das ist eine erhebliche Verbesserung, die zeigt, dass sie viel besser in sicheren und angemessenen Grenzen bleiben.
OpenAI arbeitet eng mit Sicherheitsorganisationen in den USA und Großbritannien zusammen. Sie haben diesen Instituten sogar einen frühen Zugang zu den Modellen gegeben, um bei der Forschung zu helfen und sicherzustellen, dass alles auf dem neuesten Stand ist.
Was kommt als nächstes?
Dies ist nur der Anfang. OpenAI plant regelmäßige Aktualisierungen und Verbesserungen dieser Modelle. Sie möchten Funktionen wie das Durchsuchen des Webs, das Hochladen von Dateien und Bildern und vieles mehr hinzufügen, um sie noch hilfreicher zu machen.
Sie entwickeln auch weiterhin Modelle in der GPT -Serie zusammen mit dieser neuen O1 -Serie, also gibt es viel zu freuen.
Letzte Gedanken
Der Start der O1-Präview- und O1-Mini-Modelle ist in der KI-Welt eine große Sache. Sie stellen einen signifikanten Schritt nach vorne dar, wie KI durch komplexe Probleme argumentieren kann. Mit besserer Leistung und verbesserten Sicherheitsmaßnahmen werden diese Modelle für viele Menschen, die an herausfordernden Aufgaben arbeiten, Spielveränderer sein.
Seien Sie gespannt auf das Vidhya -Blog von Analytics, um mehr über die Verwendung von O1 und O1 Mini zu erfahren!
Das obige ist der detaillierte Inhalt vonOpenAI O1: Ein neues Modell, das „denkt', bevor sie Probleme beantworten. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Einführung Angenommen, es gibt einen Landwirt, der täglich den Fortschritt von Pflanzen in mehreren Wochen beobachtet. Er untersucht die Wachstumsraten und beginnt darüber nachzudenken, wie viel größerer seine Pflanzen in weiteren Wochen wachsen könnten. Von th

Soft AI-definiert als KI-Systeme zur Ausführung spezifischer, enger Aufgaben mit ungefährem Denken, Mustererkennung und flexibler Entscheidungsfindung-versucht, ein menschliches Denken nachzuahmen, indem sie Mehrdeutigkeiten einnehmen. Aber was bedeutet das für das Geschäft

Die Antwort ist klar-genau da Cloud Computing eine Verschiebung zu Cloud-nativen Sicherheitstools erfordert, erfordert KI eine neue Generation von Sicherheitslösungen, die speziell für die individuellen Anforderungen von AI entwickelt wurden. Der Aufstieg von Cloud -Computing- und Sicherheitsstunden gelernt In th

Unternehmer und Verwendung von KI und Generative KI, um ihre Geschäfte besser zu machen. Gleichzeitig ist es wichtig, sich zu erinnern, wie alle Technologien ein Verstärker ist. Eine strenge Studie von 2024 o

Schalte die Kraft des Einbettungsmodelle frei: einen tiefen Eintauchen in den neuen Kurs von Andrew Ng Stellen Sie sich eine Zukunft vor, in der Maschinen Ihre Fragen mit perfekter Genauigkeit verstehen und beantworten. Dies ist keine Science -Fiction; Dank der Fortschritte in der KI wird es zu einem R

Großsprachenmodelle (LLMs) und das unvermeidliche Problem der Halluzinationen Sie haben wahrscheinlich AI -Modelle wie Chatgpt, Claude und Gemini verwendet. Dies sind alles Beispiele für große Sprachmodelle (LLMs), leistungsstarke KI -Systeme, die auf massiven Textdatensätzen geschult wurden

Jüngste Untersuchungen haben gezeigt, dass KI-Übersichten einen Rückgang des organischen Verkehrs um 15-64% auf der Grundlage der Industrie und des Suchtyps verursachen können. Dieser radikale Wandel veranlasst Vermarkter, ihre gesamte Strategie in Bezug auf digitale Sichtbarkeit zu überdenken. Das Neue

Ein kürzlich von Elon University vorstellbarer Bericht des Digital Future Center befragte fast 300 globale Technologieexperten. Der daraus resultierende Bericht, „im Jahr 2035 Menschen zu sein“, kam zu dem Schluss, dass die meisten besorgt sind


Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Herunterladen der Mac-Version des Atom-Editors
Der beliebteste Open-Source-Editor

VSCode Windows 64-Bit-Download
Ein kostenloser und leistungsstarker IDE-Editor von Microsoft

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

DVWA
Damn Vulnerable Web App (DVWA) ist eine PHP/MySQL-Webanwendung, die sehr anfällig ist. Seine Hauptziele bestehen darin, Sicherheitsexperten dabei zu helfen, ihre Fähigkeiten und Tools in einem rechtlichen Umfeld zu testen, Webentwicklern dabei zu helfen, den Prozess der Sicherung von Webanwendungen besser zu verstehen, und Lehrern/Schülern dabei zu helfen, in einer Unterrichtsumgebung Webanwendungen zu lehren/lernen Sicherheit. Das Ziel von DVWA besteht darin, einige der häufigsten Web-Schwachstellen über eine einfache und unkomplizierte Benutzeroberfläche mit unterschiedlichen Schwierigkeitsgraden zu üben. Bitte beachten Sie, dass diese Software