Heim > Artikel > Technologie-Peripheriegeräte > Baidu-Gründer Robin Li: Wir stehen kurz vor dem Beginn einer KI-nativen Ära
„Caijing“-Autor für neue Medien Wang Jingya/Text Gao Suying/Herausgeber
„Wir stehen kurz vor dem Eintritt in eine Ära der nativen KI, eine Ära, in der Menschen und Maschinen durch Eingabeaufforderungen interagieren und die Zukunft von uns gemeinsam gestaltet wird.“ Am 17. Oktober sagte Robin Li, Gründer, Vorsitzender und CEO von Baidu, auf der Baidu-Weltkonferenz 2023:
Er gab sofort bekannt, dass Baidu Wenxin offiziell auf Version 4.0 aktualisiert wurde. Im Vergleich zur Vorgängerversion wurden in der neuen Version erhebliche Verbesserungen in den vier Hauptfunktionen Verständnis, Generierung, Logik und Speicher erzielt, und ihr Gesamtniveau ist GPT4 nicht unterlegen. Dies ist derzeit Baidus stärkstes Wenxin-Großmodell, das eine umfassende Verbesserung des Basismodells erreicht hat.
Robin Li demonstrierte die Eigenschaften und Anwendungsszenarien der vier Hauptfähigkeiten von Wen Xinyiyan: Verständnis, Erzeugung, Logik und Gedächtnis. Robin Li glaubt, dass diese Fähigkeiten in der vergangenen Ära nicht verfügbar waren und daher unbegrenzten Raum für Innovationen eröffnen können.
Insbesondere im Hinblick auf die Fähigkeit zum Verstehen hat sich die KI von einer „künstlichen Behinderung“, die menschliche Sprache nicht verstehen kann, zu einer Fähigkeit entwickelt, die fast die gesamte Sprache versteht und sogar besser versteht, was der Benutzer sagt, als seine Freunde und Kollegen. In Bezug auf die Generierungsfähigkeiten hat Wen Xinyiyan auf der Grundlage von Bildmaterial und mehreren Schlüsselwörtern von Robin Li in nur 3 Minuten 1 Werbevideo, 5 Werbetexte und 1 Poster erstellt. Basierend auf dieser Fähigkeit hat Baidu das AIGC-Marketing gestartet Kreativplattform Qingduo.
In Bezug auf die logischen Fähigkeiten ist die Anwendung des großen Wenxin-Modells besonders offensichtlich in Szenarien wie der Lösung mathematischer Probleme und der Zusammenfassung von Wissenspunkten. Robin Li sagte, dass neben der Problemlösung auch logische Fähigkeiten für die Routenplanung auf Smart Maps, die Bewältigung komplexer Aufgaben durch Smart Assistants, die Ampelsteuerung in Smart Transportsystemen usw. erforderlich seien. Robin Li wies darauf hin, dass es im Hinblick auf die Gedächtnisleistung ein wichtiger Indikator für die Unterscheidung der Intelligenz eines großen Modells ist, ob sich die KI an das erinnert, was der Benutzer gesagt hat, und ob der von der KI generierte Inhalt vorher und nachher inkonsistent ist Dialogrunden sind die Verkörperung der Gedächtnisfähigkeit.
Es sollte nicht außer Acht gelassen werden, dass die vier Hauptfunktionen des großen Modells nicht unabhängig voneinander existieren, sondern in bestimmten Szenarien einander ergänzen. Nach Ansicht von Robin Li sind Verständnis, Generierung, Logik und Speicherfähigkeiten die Grundlage für das Überleben aller nativen KI-Anwendungen. Wenn Sie beispielsweise Werbetexte erstellen, müssen Sie das kreative Thema verstehen, die kreative Logik klären und die Konsistenz im Gedächtnis wahren. Bei der Lösung von Problemen müssen diese vier Fähigkeiten auch umfassend eingesetzt werden.
Es ist erwähnenswert, dass das ultimative Ziel der Großmodelltechnologie aus allen Lebensbereichen immer noch darin besteht, den Menschen zu dienen, und die praktische Anwendung der Schlüssel zur Entwicklung von KI ist. „Native KI-Anwendungen sind Anwendungen, die auf dem Verständnis, der Generierung, der Logik und den Speicherfähigkeiten großer Modelle basieren.“ Robin Li glaubt, dass das Basismodell ohne umfangreiche native KI-Anwendungen, die auf dem Basismodell basieren, keinen Wert hat.
Robin Li demonstrierte mehr als 10 Fälle nativer KI-Anwendungen basierend auf Wen Xinyiyans Rekonstruktion von Baidu Search, Ruliu, Maps, Netdisk und Wenku und hoffte, Entwickler zur Zusammenarbeit bei der Entwicklung weiterer erstaunlicher nativer KI-Anwendungen zu inspirieren. Seiner Ansicht nach „verfügt China über vielfältige Anwendungsszenarien und chinesische Nutzer sind bereit, neue Technologien anzunehmen. Mit fortschrittlichen Basismodellen im großen Maßstab können wir ein florierendes KI-Ökosystem aufbauen und gemeinsam eine neue Runde des Wirtschaftswachstums schaffen.“
Bei der Entwicklung nativer KI-Anwendungen sind die grundlegenden Fähigkeiten großer Modelle entscheidend. Robin Li sagte, dass API die wichtigste Möglichkeit für native KI-Anwendungen sei, grundlegende große Modelle aufzurufen. Derzeit sind auf der Qianfan-Plattform für große Models 42 Mainstream-Großmodels angesiedelt, die fast 500 Szenen in verschiedenen Branchen abdecken.Es ist erwähnenswert, dass sich die Rekonstruktion großer Modelle nicht nur auf Online-Anwendungen, sondern auch auf die Offline-Arbeit und das Offline-Leben auswirkt. Es wird weiterhin eine große Anzahl nativer KI-Anwendungen entstehen, die die tiefe Integration digitaler Technologie und der Realwirtschaft fördern. Gegenwärtig wird die Großmodelltechnologie in der Fertigung, Energie, Elektrizität, chemischen Industrie, im Transportwesen und anderen realen Industriezweigen eingesetzt und entwickelt sich zu einer wichtigen Triebkraft für die neue Industrialisierung.
Robin Li glaubt, dass durch die Anregungen jedes Unternehmens, jedes Entwicklers und jedes Benutzers eine neue Welt und eine neue Zukunft entstehen werden. Zukünftige native KI-Anwendungen müssen multimodal sein und werden neben der Informationswelt auch die physische Welt rekonstruieren.
Das obige ist der detaillierte Inhalt vonBaidu-Gründer Robin Li: Wir stehen kurz vor dem Beginn einer KI-nativen Ära. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!