Heim > Artikel > Technologie-Peripheriegeräte > Google veröffentlicht multimodalen Bard-Assistenten: ein weiterer Meilenstein in Richtung der Ära der interaktiven KI
Auf einer neuen Produkteinführungskonferenz hat Google vor einigen Tagen offiziell die neue Generation der Android-Flaggschiff-Telefone der Pixel 8/Pro-Serie vorgestellt, die mit dem Tensor G3-Chip ausgestattet sind. Dieser Chip kann komplexere ML-Modelle (maschinelles Lernen) ausführen und mehrere hinzufügen KI-Funktionen für das neue Telefon, wie das Vorlesen von Webseiten für Benutzer in verschiedenen Sprachen und „natürlicheren“ Stimmen sowie natürlicheres Sprechen virtueller Assistenten.
Google wies darauf hin, dass Pixel 8 Pro das erste Telefon ist, das das grundlegende große Modell von Google direkt auf dem Gerät ausführt, was eine 150-fache Berechnung des größten ML-Modells auf Pixel 7 erfordert.
Gleichzeitig kündigte Google die Einführung von „Assistant with Bard“ für Android- und iOS-Geräte an, das die persönliche Assistentenfunktion des Telefons mit generativer KI kombiniert. Benutzer können mit dem Bard Assistant über Text, Sprache oder Bilder interagieren Mit anderen Worten, es verfügt über multimodale Fähigkeiten.
Wenn Benutzer fragen: „Welche wichtigen E-Mails habe ich diese Woche verpasst?“, stellt Bard Assistant die folgenden Dienste bereit: Zunächst werden die wichtigsten Punkte und spezifischen Inhalte jeder wichtigen E-Mail aufgelistet und Links zu den entsprechenden E-Mails bereitgestellt. Zweitens kann es Benutzern auch dabei helfen, aktive Adressen zu extrahieren und sie in Google Maps anzuzeigen
Wenn der Benutzer ein Foto eines Welpen in den sozialen Medien posten möchte, muss er nur das schwebende Dialogfeld des Bardenassistenten aufrufen und ihn bitten, den Posting-Inhalt zu schreiben. Der Bard-Assistent erkennt das Bild und schreibt den entsprechenden Inhalt.
Google gab bekannt, dass es Bard Assistant bald den ersten Testern zur Verfügung stellen wird, um Feedback zu erhalten und es in den kommenden Monaten der Öffentlichkeit zugänglich zu machen.
Darüber hinaus sagte Mustafa Suleyman, Mitbegründer von DeepMind, kürzlich in einem Interview:
Die derzeitige generative KI ist nur eine technische Übergangsphase und wird als nächstes in die Ära der interaktiven KI eintreten. KI wird Aufgaben basierend auf den Unterschieden arrangieren Aufgabenanforderungen der Benutzer anderer Software und/oder Kontaktaufnahme mit echten Menschen, um die Arbeit zu erledigen.
Er glaubt, dass sich die erste Welle der künstlichen Intelligenz hauptsächlich auf die Klassifizierung konzentrierte – Deep Learning zeigt, dass Menschen künstliche Intelligenz trainieren können, um Eingabedaten wie Bilder, Videos, Audios und Sprachen zu klassifizieren. Die Menschheit befindet sich derzeit in der zweiten Welle der „generativen künstlichen Intelligenz“, die darin besteht, „Daten einzugeben und neue Daten zu generieren“. Die dritte Welle in der Zukunft wird zur „interaktiven künstlichen Intelligenz“ gehören. „Konversation ist die interaktive Schnittstelle der Zukunft.“ Bis dahin wird die interaktive künstliche Intelligenz nicht nur auf Schaltflächen klicken und Text eingeben selbstständig Maßnahmen zu ergreifenTianfeng Securities wies darauf hin, dass
Die Bedeutung von Szenarien in der Implementierungsphase von C-seitigen KI-Anwendungen immer wichtiger geworden ist, wobei Chatbots, KI-Begleiter und Content-Produktionstool-Szenarien die ersten sind, die implementiert werden. Die Entwicklungsgeschwindigkeit und der Kommerzialisierungsfortschritt von KI-Anwendungen in diesen Szenarien können die Erwartungen übertreffen.
Nach den Prognosen der Analysten werden sich die Iteration künstlicher Intelligenz und die katalytische Wirkung späterer Ereignisse weiter beschleunigen. In der zweiten Jahreshälfte wird die Iterationsgeschwindigkeit von Anwendungen und Modellen ausländischer Riesenunternehmen deutlich verbessert, und es wird erwartet, dass die Fähigkeiten allgemeiner Chatbots weiter verbessert werden. Dies kann zu einer Verbesserung des Benutzererlebnisses führen und die Anzahl der Benutzer weiter erhöhenDarüber hinaus fügte Huajin Securities hinzu, dass die Verlagerung großer Modelle von allgemeinen zu vertikalen Szenarien eher eine Untersuchung der Kommerzialisierung sei und die treibende Kraft dafür sei, dass große Modelle vom Training zur Inferenz übergehen.
Mit der Entwicklung und Verbesserung vertikaler Großmodelle ist die Anwendung großer Modelle der Schlüssel zur Erschließung größerer Wachstumsmöglichkeiten. Edge Computing ist ein klarer und riesiger inkrementeller Markt, der inzwischen die Phase der Branchenimplementierung erreicht hat. Cloud-Computing-Unternehmen, Telekommunikationsbetreiber, Gerätehersteller, CDN-Unternehmen usw. fördern aktiv die Branchenimplementierung. Der umgeschriebene Inhalt ist: Quelle: Financial Associated Press
Das obige ist der detaillierte Inhalt vonGoogle veröffentlicht multimodalen Bard-Assistenten: ein weiterer Meilenstein in Richtung der Ära der interaktiven KI. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!