Heim >Technologie-Peripheriegeräte >KI >GPT-4o bringt GPT-4 zu jedem, und so funktioniert es
Also, was ist GPT-4o?
GPT-4o ist das neueste KI-Modell des ChatGPT-Entwicklers OpenAI, das auf der „Spring Update“-Veranstaltung Anfang Mai 2024 vorgestellt wurde. Es wird zumindest vorerst mit seinem bisherigen Spitzenmodell GPT-4 Turbo koexistieren und bringt eine Vielzahl von Updates für das Tool mit sich.
Im Gegensatz zu seinen Vorgängern ist GPT-4o vom Start an vollständig multimodal (das „o“ im Modellnamen steht für „omnimodal“). Bei der Frühlingsaktualisierungsveranstaltung von OpenAI wurde GPT-4o vorgestellt, der sich fließend mit den Veranstaltungsveranstaltern unterhielt, zwischen Interaktionen hin und her wechselte, „Persönlichkeit“ zur Schau stellte und veranschaulichte, wie er zu dem virtuellen Assistenten werden könnte, von dem Benutzer geträumt haben.
Es kann Kombinationen aus Audio, Text, Bild und Video als Ein- und Ausgabe in Text, Audio und Bild akzeptieren (noch keine Videounterstützung, aber es wird erwartet, dass sich das ändert, sobald das Text-zu-Video-Tool Sora von OpenAI startet – zumindest). , das ist es, was ich vermute.
In Bezug auf die von OpenAI bereitgestellten Rohzahlen übertrifft GPT-4o alle seine Vorgängermodelle sowie seine nächsten Konkurrenten wie Claude 3 Opus, Gemini Pro 1.5 und Ultra 1.0 sowie Llama 3 400B.
Nun, Zahlen sind alle schön und gut, aber was bedeutet das eigentlich? Nun, noch einmal: Basierend auf den Zahlen von OpenAI erreicht GPT-4o beim Schreiben und Codieren in Englisch „die Turbo-Leistung von GPT-4“, ist in „nicht-englischen Sprachen“ deutlich schneller und, was am wichtigsten ist, in Bezug auf die API schneller und günstiger verwenden.
Ich arbeite schon lange im Technologiebereich und habe viele glänzende neue „Game-Changer“ kommen und gehen sehen. Aber die Konversationssprache des GPT-4o ist wirklich brillant. GPT-4o kann richtige Gespräche mit Ihnen führen und ermöglicht Ihnen sogar, zu unterbrechen, den Gesprächsschwerpunkt zu ändern, das Thema zu wechseln und vieles mehr, fast ohne einen Takt auszusetzen.
Seine Fähigkeit, sich schnell zu unterhalten, eröffnet eine ganze Reihe neuer Anwendungsmöglichkeiten. Während ChatGPT bereits über eine Sprachfunktion verfügte, war diese eingeschränkt, da zunächst eine Antwort geschrieben werden musste, die dann mit Ihnen gesprochen werden konnte. Sie könnten mit ChatGPT auch über Ihre Stimme interagieren, die Bearbeitung Ihrer Anfrage würde jedoch einige Zeit in Anspruch nehmen.
Jetzt ist die Echtzeitstimme von GPT-4o nahezu nahtlos. Darüber hinaus kann es Emotionen und spezifische Stile ausdrücken, was vor diesem Update wiederum unmöglich war.
Dies gilt auch für die Live-Übersetzung, bei der GPT-4o eine enorme Verbesserung zeigte. Nun, ich kenne mich in keiner anderen Sprache gut aus, aber die Live-Übersetzung vom Englischen ins Italienische und zurück kam gut an; Alles, was die Kommunikation im Ausland erleichtert, ist ein enormer Segen, insbesondere angesichts der Geschwindigkeit der Übersetzung.
Ich war vor Kurzem in Marokko, und selbst wenn Google Translate dabei hilft, etwas Bedeutung ins Arabische zu bringen, ist der vollständige Kontext der Übersetzung nie ganz korrekt. Die Live-Übersetzung von GPT-4o wäre unglaublich nützlich gewesen!
GPT-4o bietet dank seiner multimodalen Funktionen auch erhebliche Verbesserungen bei der Codeinterpretation und -unterstützung. Ähnlich wie die anderen Tools könnte ChatGPT bereits mit einigen Daten arbeiten, aber sein neues Modell steigert dies drastisch.
Die Möglichkeit, Code nur mit Ihrer Stimme zu debuggen, ist bemerkenswert. Sein tatsächlicher Nutzen wird jedoch erst klar, wenn tatsächliche Programmierer und Entwickler beginnen, das Tool zu nutzen. Die Codierungsfähigkeiten von ChatGPT sind zwar nützlich, aber wie bei den meisten generativen KI-Tools sind sie nur so nützlich wie das Wissen des Benutzers.
GPT-4o wurde sofort für ChatGPT Plus-Abonnenten eingeführt, die die monatliche Gebühr von 20 US-Dollar zahlen. Aber in einem weiteren großen Moment für generative KI gab OpenAI bekannt, dass GPT-4o zu gegebener Zeit für alle Benutzer – einschließlich kostenloser Benutzer – verfügbar sein würde.
Es gibt kein bestimmtes Datum für die Einführung von GPT-4o bei kostenlosen ChatGPT-Konten, aber angesichts der Geschwindigkeit anderer Rollouts sollte es nicht allzu lange dauern.
Auch andere Aspekte des neuen Modells sind noch nicht verfügbar. Ich wollte zum Beispiel einen kurzen Clip der neuen Live-Voice-Funktion für diesen Artikel machen, aber die Funktion wurde noch nicht gestartet (ich bin ein langjähriger ChatGPT Plus-Abonnent) und hat auch noch nicht den Weg zu irgendeinem Kollegen gefunden Konten.
GPT-4o wird auch eine lang erwartete ChatGPT-Desktop-Version bringen, beginnend mit macOS, aber auch diese ist noch nicht gestartet.
Das obige ist der detaillierte Inhalt vonGPT-4o bringt GPT-4 zu jedem, und so funktioniert es. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!