Heim >Technologie-Peripheriegeräte >KI >OpenAI und Google haben an zwei aufeinanderfolgenden Tagen große Schritte unternommen, beide wollen KI-Assistenten „intelligent' machen

OpenAI und Google haben an zwei aufeinanderfolgenden Tagen große Schritte unternommen, beide wollen KI-Assistenten „intelligent' machen

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOriginal: 2024-06-03 15:23:07383Durchsuche

Nachdem wir gestern die Frühjahrsveröffentlichung von OpenAI gesehen haben, ist es nicht schwer zu erraten, dass es auf der heutigen Google I/O-Konferenz definitiv eine Einführung in KI-Assistenten geben wird.

Schließlich hat Altman, der GPT-4o vor der Google I/O-Konferenz veröffentlicht hat, volle Relevanz bewiesen. Mit Altmans Methoden ist er natürlich zuversichtlich, genau zuzuschlagen und diese „rote und blaue“ „Konfrontation“ bis zum Ende zu beseitigen .

Tatsächlich wurde auf der Konferenz von Google-CEO Pichai der neue KI-Assistent Project Astra von Google vorgestellt, der sein Debüt auf der Google I/O-Konferenz gab.

OpenAI und Google haben an zwei aufeinanderfolgenden Tagen große Schritte unternommen, beide wollen KI-Assistenten „intelligent machen

Was ist Projekt Astra?

Project Astra ist ein multimodaler Echtzeit-Assistent für allgemeine künstliche Intelligenz mit Google Gemini als Basis-Engine, der dem Nachfolger von Google Assistant entspricht.

Genau wie Siri, Alexa und andere KI-Assistenten, die wir in der Vergangenheit verwendet haben, können Sie immer noch mit der Stimme interagieren. Der Unterschied besteht darin, dass sie dank der einzigartigen Eigenschaften der generativen KI jetzt über bessere Verständnisfähigkeiten verfügt mehr Dinge, und was noch wichtiger ist, dieses Mal verfügt es auch über visuelle Erkennungsfunktionen, die es dem KI-Assistenten ermöglichen, die Welt mit offenen Augen zu sehen.

In der Videodemonstration von Google auf der Konferenz lag der Fokus auf der visuellen Intelligenz dieses KI-Assistenten.

In dem Demonstrationsvideo hielt ein Google-Ingenieur ein Mobiltelefon mit eingeschalteter Kamera in der Hand und ermöglichte es Gemini, Objekte zu identifizieren, die Geräusche im Raum erzeugen, den auf dem Monitorbildschirm angezeigten Code zu identifizieren und sogar die aktuelle Adresse des Moderators zu identifizieren durch Straßenansichten im Freien.

Als der Ingenieur die mit diesem KI-Assistenten ausgestattete Datenbrille auf das auf der Tafel entworfene System richtete, wandte Google den KI-Assistenten auch auf Mobiltelefone an Wie das System verbessert werden kann, kann der KI-Assistent sogar Vorschläge zur Verbesserung des Systemdesigns machen.

Dies ist die visuelle Intelligenz, die Google auf dem KI-Assistenten anzeigt. Mit dem Segen von Gemini wurden die interaktiven Fähigkeiten solcher KI-Assistenten erheblich verbessert.

Allerdings liegt ein solcher KI-Assistent hinsichtlich der Natürlichkeit der tatsächlichen Interaktion noch weit hinter den Ergebnissen zurück, die OpenAI GPT-4o gestern gezeigt hat.

OpenAI hat erfolgreich abgeschnitten

Nur einen Tag vor der Google I/O-Konferenz veranstaltete OpenAI eine große Frühjahrskonferenz, bei der der Schlüssel zum Einsatz von KI-Assistenten auf Mobiltelefonen lag Funktion, die auf dieser Konferenz demonstriert wurde.

Nach den auf der OpenAI-Konferenz demonstrierten Fähigkeiten des KI-Assistenten zu urteilen, ist der Demonstrationseffekt hinsichtlich der Benutzerfreundlichkeit des Demonstrationsinhalts, der Natürlichkeit des Interaktionsprozesses und der multimodalen Fähigkeiten dieses KI-Assistenten besser .

Das liegt daran, dass OpenAI beim Laden von GPT-4o auf das Mobiltelefon nicht nur visuelle Intelligenz hinzufügte, sondern es dem KI-Assistenten auch ermöglichte, in Echtzeit zu reagieren (die offizielle durchschnittliche Antwortverzögerung beträgt 320 Millisekunden) und kann Jederzeit getroffen werden kann, kann sogar menschliche Emotionen verstehen.

Während der Demonstration der Fähigkeiten der visuellen Intelligenz schrieb OpenAI eine mathematische Gleichung auf Papier, damit der KI-Assistent das Problem Schritt für Schritt lösen konnte, ähnlich wie ein Grundschullehrer.

Und wenn Sie mit GPT-4o einen „Videoanruf“ tätigen, kann es Ihren Gesichtsausdruck erkennen, Ihre Gefühle verstehen und wissen, ob Sie jetzt glücklich oder traurig aussehen, genau wie ein Mensch.

Es ist nicht schwer festzustellen, dass sowohl Google als auch OpenAI mit Unterstützung der heutigen Großmodelltechnologie versuchen, den ursprünglichen groben KI-Assistenten neu zu erfinden, in der Hoffnung, dass der KI-Assistent interagieren kann bei uns natürlich wie echte Menschen.

Den Videodemonstrationsergebnissen der beiden Konferenzen davor und danach nach zu urteilen, hat uns der KI-Assistent, der große Modelle als Basismotor verwendet, tatsächlich deutlich das Gefühl gegeben, dass es einen deutlichen Generationsunterschied zwischen dem aktuellen KI-Assistenten und dem vorherigen Siri gibt und Alexa.

Da die Entwicklung der generativen KI und der Großmodelltechnologie in vollem Gange ist, versucht Apple auch, Siri neu zu erfinden. Zuvor berichtete Bloomberg unter Berufung auf mit der Angelegenheit vertraute Personen, dass Apple über eine Zusammenarbeit mit OpenAI und Google spreche ihre großen Modelle auf das Betriebssystem iOS 18 umstellen.

Ob ein solcher KI-Assistent Siri wieder populär machen und zu einer Killeranwendung für KI-Telefone werden kann, hängt davon ab, ob Apple den KI-Assistenten wieder erfolgreich „verzaubern“ kann.

Das obige ist der detaillierte Inhalt vonOpenAI und Google haben an zwei aufeinanderfolgenden Tagen große Schritte unternommen, beide wollen KI-Assistenten „intelligent' machen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

ios 人工智能 ar gpt

Stellungnahme：

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Vorheriger Artikel：Grundlegende Fähigkeiten und Eigenschaften eines Chief Artificial Intelligence OfficerNächster Artikel：Grundlegende Fähigkeiten und Eigenschaften eines Chief Artificial Intelligence Officer

In Verbindung stehende Artikel

Mehr sehen