Heim > Artikel > Technologie-Peripheriegeräte > Ein weiterer generativer KI-Assistent wird „an Bord“ sein! Google veröffentlicht multimodalen Bard-Assistenten. Steht die Ära der interaktiven KI bevor?
Am 6. Oktober stellte Google auf der neuen Produkteinführungskonferenz offiziell die neue Generation der Android-Flaggschiff-Telefone der Pixel 8/Pro-Serie vor. Dieses Telefon ist mit einem Tensor G3-Chip ausgestattet, der komplexere Modelle des maschinellen Lernens ausführen kann und dem neuen Telefon eine Reihe von Verbesserungen der künstlichen Intelligenz verleiht. Beispielsweise kann es Benutzern Webinhalte in verschiedenen Sprachen mit einer natürlicheren Stimme vorlesen, wodurch die Gespräche des virtuellen Assistenten natürlicher und reibungsloser werden
Pixel 8 Pro ist das erste Telefon, das das große Basismodell von Google direkt auf dem Gerät ausführen kann, das laut Google 150-mal rechenintensiver ist als das größte ML-Modell auf Pixel 7
Google hat die Einführung von „Assistant with Bard“ angekündigt, das auf Android- und iOS-Geräten verfügbar ist. Der Assistent kombiniert die persönliche Assistentenfunktion des Telefons mit generativer künstlicher Intelligenz. Benutzer können mit dem Bard Assistant über Text, Sprache oder Bilder interagieren, was bedeutet, dass er über multimodale Funktionalität verfügt
Wenn Benutzer fragen: „Welche wichtigen E-Mails habe ich diese Woche verpasst?“, stellt Bard Assistant die folgenden Dienste bereit: Zunächst werden die wichtigsten Punkte und spezifischen Inhalte aufgelistet und Links zu den entsprechenden E-Mails bereitgestellt. Darüber hinaus können Benutzer damit auch aktive Adressen extrahieren und in Google Maps anzeigen
Wenn der Benutzer ein Foto eines Welpen in den sozialen Medien posten möchte, muss er nur das schwebende Dialogfeld des Bardenassistenten aufrufen und ihn bitten, den Posting-Inhalt zu schreiben. Der Bard-Assistent erkennt das Bild und schreibt den entsprechenden Inhalt.
Google gab bekannt, dass es den Bard Assistant bald den ersten Testern zur Verfügung stellen wird, um Feedback einzuholen und ihn in den kommenden Monaten der Öffentlichkeit zugänglich zu machen.
Darüber hinaus sagte DeepMind-Mitbegründer Mustafa Suleyman kürzlich in einem Interview, dass die aktuelle Phase der generativen KI nur eine technische Übergangsphase sei und als nächstes in die Ära der interaktiven KI eintreten werde, um andere Software entsprechend den unterschiedlichen Aufgabenanforderungen anzuordnen der Benutzer und/oder wenden Sie sich an eine echte Person, um die Arbeit zu erledigen.
Er glaubt, dass sich die erste Welle der KI hauptsächlich auf die Klassifizierung konzentriert – Deep Learning zeigt, dass Menschen KI trainieren können, Eingabedaten wie Bilder, Videos, Audios und Sprachen zu klassifizieren. Die Menschheit befindet sich derzeit in der zweiten Welle der „generativen KI“, was so viel wie „Daten eingeben und neue Daten generieren“ bedeutet. Die dritte Welle in der Zukunft wird zur „interaktiven KI“ gehören. „Der Dialog ist die interaktive Schnittstelle der Zukunft.“ Bis dahin wird die interaktive KI nicht nur auf Schaltflächen klicken und Text eingeben können eigenständiges Handeln.
Tianfeng Securities gab an, dass die Bedeutung von Szenarien in der Implementierungsphase von C-seitigen Anwendungen für künstliche Intelligenz immer wichtiger geworden ist. Szenarien wie Chat-Roboter, Begleiter für künstliche Intelligenz und Tools zur Inhaltserstellung sind die ersten, die implementiert werden Die Kommerzialisierung künstlicher Intelligenzanwendungen in diesen Szenarien kann die Erwartungen übertreffen
Analysten gehen davon aus, dass sich die Iterationen der KI und die spätere Ereigniskatalyse weiter beschleunigen werden. Ab der zweiten Jahreshälfte wird die Iterationsgeschwindigkeit der Anwendungen und Modelle ausländischer Giganten voraussichtlich weiter verbessert. Dies kann zu einer Verbesserung der Benutzererfahrung und einem weiteren Wachstum der Benutzerzahl führen.
Darüber hinaus fügte Huajin Securities hinzu, dass die Verlagerung großer Modelle von allgemeinen zu vertikalen Szenarien eher eine Untersuchung der Kommerzialisierung sei und die treibende Kraft dafür sei, dass große Modelle vom Training zur Inferenz übergehen. Mit der Entwicklung und Verbesserung vertikaler Großmodelle ist die Anwendung großer Modelle der Schlüssel zur Erschließung größerer Wachstumsmöglichkeiten. Edge Computing ist ein klarer und riesiger inkrementeller Markt, der inzwischen das Stadium der industriellen Umsetzung erreicht hat. Cloud-Computing-Unternehmen, Telekommunikationsbetreiber, Gerätehersteller, CDN-Unternehmen usw. fördern aktiv die Umsetzung der Branche.
【Quelle: Science and Technology Innovation Board Daily】
Das obige ist der detaillierte Inhalt vonEin weiterer generativer KI-Assistent wird „an Bord“ sein! Google veröffentlicht multimodalen Bard-Assistenten. Steht die Ära der interaktiven KI bevor?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!