Heim  >  Artikel  >  Hardware-Tutorial  >  Lanzhou besteht darauf, alle Anstrengungen zu unternehmen: Um die ToB-Szene umzusetzen, reicht ein großes Modell mit 10B-Parametern

Lanzhou besteht darauf, alle Anstrengungen zu unternehmen: Um die ToB-Szene umzusetzen, reicht ein großes Modell mit 10B-Parametern

王林
王林nach vorne
2024-03-21 12:21:40836Durchsuche

Fokus, Perfektion, Ruf, Geschwindigkeit und Kosten.

Zhou Ming ist der Gründer und CEO von Lanzhou Technology. Er schlug die „Neun-Zeichen-Regel für die Implementierung großer Modelle“ vor, die auf Lei Juns „Sieben-Zeichen-Regel“ für das Internet basiert und das Wort „Kosten“ hinzufügt.

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

Er nannte 2024 das erste Jahr der großen Modelle, stellte aber gleichzeitig fest, dass dies nicht bedeute, dass überall Gold sei.

Was die konkrete Umsetzung des großen Modells angeht, hat Zhou Ming mit dem von ihm geleiteten großen Modell-Unternehmerteam Lanzhou Technology ein Beispiel gegeben – unter Verwendung des „eine horizontale und N vertikale“-Systems von Lanzhou, basierend auf dem Mencius-Großmodell, orientiert an Szenarien. Produktveröffentlichung.

Einfach ausgedrückt handelt es sich um einen Zweiradantrieb von Technologie und Anwendung. Während wir aktiv Spitzentechnologien erforschen und beherrschen, sind wir bestrebt, die effektive Anwendung dieser Technologien sicherzustellen.

Auf der groß angelegten Modelltechnologie- und Produkteinführungskonferenz in Lanzhou am 18. März unterzeichnete Lanzhou Technology außerdem einen strategischen Kooperationsvertrag mit Zero-One Wanshi.

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

Vor Ort teilte Kai-fu Lee, Vorsitzender von Sinovation Ventures und CEO von Zero-One Everything, mit, dass die beste groß angelegte Modellintelligenz der Welt das Dreifache des durchschnittlichen menschlichen Intelligenzniveaus erreicht habe Mit anderen Worten, 100 Fragen können nur von normalen Menschen beantwortet werden. Es gibt 33 richtige Antworten, und das beste große KI-Modell kann mehr als 99 Fragen richtig beantworten.

Er freute sich auf die vier großen Zukunftstrends der KI-2.0-Ära:

Die revolutionärsten KI-2.0-Anwendungen sollten AI-First / AI-Native sein: Die Anwendungen, die letztendlich herausragen, gehören den Pionieren, die wagen, voll in neue Technologien zu investieren. Die Einführung großer Sprachmodelle hat den AI-First-Anwendungen enorme Impulse verliehen.

Große Modelle beginnen mit Text und werden in Zukunft auf „alle Modi“ ausgeweitet: Die modalübergreifende Generierungstechnologie ist ein Wendepunkt bei der Verwirklichung kognitiver und entscheidungsrelevanter Intelligenz. Die Informationen der realen Welt sind ein umfassendes System aus Text, Audio, Bild, Sensoren und verschiedenen menschlichen Berührungsempfindungen. Um die reale Welt genauer zu simulieren, ist es notwendig, verschiedene modale Fähigkeiten zu erschließen, wie z. B. Text-Bild, Text-. Video- und andere modalübergreifende Systeme.

KI 2.0 wird über Gespräche hinausgehen, von Chat-Tools bis hin zu intelligenten Produktivitätstools: Die Benutzererfahrung sowie zukünftige interaktive Schnittstellen und Geschäftsmodelle werden große Veränderungen erfahren.

KI 2.0 wird physisch werden und die soziale Produktivität erheblich steigern: Verkörperte Intelligenz kann es Robotern ermöglichen, Roboter herzustellen, wodurch die intelligente Planung von Produktionslinien durch KI 2.0+ weiter realisiert wird.

Fokus auf die Forschung und Entwicklung von 10B-100B-Parameter-Großmodellen

Lanzhou Technology wurde im Juni 2021 gegründet. Es ist eines der ersten Teams in China, das ein großes Modellgeschäft startet.

Im März letzten Jahres veröffentlichte Lanzhou Mencius GPT V1 (MChat); im Januar dieses Jahres veröffentlichte Mencius großes Modell GPT V2 (einschließlich Mencius großes Modell – Standard, Mencius großes Modell – Leichtgewicht, Mencius großes Modell – Finanzen, Mencius großes Modell – Coding) ist öffentlich zugänglich.

Vor kurzem hat das Lanzhou-Team das große Modelltraining von Mengzi3-13B abgeschlossen.

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

Noch etwas: Es gibt einen großen Mitwirkenden hinter dem Mengzi-Großmodelltraining, nämlich den Mengzi-3-Datensatz mit einer Gesamtskala von 3T-Tokens, der hochwertige Datenquellen wie Webseiten, Codes, Bücher, Papiere usw.

Berichten zufolge wird das Mengzi3-13B-Modell Ende dieses Monats (30. März) in den KI-Communitys GitHub, HuggingFace, Moda und Shizhi als Open Source verfügbar sein.

Warum ist das Open-Source-Mencius-Modell Version 13B? Zhou Ming beantwortete diese Frage direkt.

Zunächst einmal konzentriert sich Lanzhou klar auf die Bereitstellung von ToB-Szenarien, ergänzt durch ToC.

Die Praxis hat herausgefunden, dass die Parameter großer Modelle, die in ToB-Szenarien am häufigsten verwendet werden, meist 7B, 13B, 40B und 100B sind und die Gesamtparameter zwischen 10B und 100B liegen.

Zweitens erfüllt es innerhalb dieses Bereichs aus Sicht des ROI nicht nur die Bedürfnisse der Szene, sondern ist auch am kostengünstigsten.

Das Ziel von Lanzhou bestand also schon lange darin, große Industriemodelle innerhalb der Parameterskala 10B-100B aufzubauen. Daher ist es schwierig zu verstehen, warum 13B für die Open-Source-Version ausgewählt wurde.

Zhou Ming erklärte, dass er selbst eigentlich an das Scaling-Gesetz glaubt, Unternehmertum jedoch etwas anderes ist als wissenschaftliche Forschung.

„Erstens kann ein großes Modell dieser Größe bereits 80 % der Probleme lösen; zweitens ist es für das Team relativ stabil und wird sich aufgrund der immer größer werdenden Konkurrenz im Modellmaßstab nicht unruhig anfühlen.“ Auf diese Weise kann ruhiges Denken eine gute Kostenkontrolle gewährleisten und unnötigen Wettbewerb um GPU-Rechenleistung, Daten und Arbeitskräfte vermeiden.

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

„One horizontal N Vertical“-System

Auf der Pressekonferenz kündigte Lanzhou sein eigenes One horizontal N Vertical-System an.

„Yiheng“ ist die Modellebene, bei der es sich um jedes auf der Grundlage der Großmodelltechnologie von Mencius entwickelte Modell handelt.

„N Vertical“ ist die wichtigste Technologie und das wichtigste Produkt für ToB-Anwendungen, die auf dem Großmodell von Mencius basieren.

Es versteht sich, dass sich Lanzhou derzeit auf die Finanzbranche, die Hilfsprogrammierung und andere Bereiche konzentriert, mit dem Ziel, durch umfassendere, professionellere und qualitativ hochwertigere Felddaten ein großes vertikales Modell zu schaffen, das den Branchenszenarien näher kommt.

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

Basierend auf der „One Horizontal“ des universellen Großmodells Mencius GPT stellte Li Jingmei, Partner und Chief Product Officer von Lanzhou Technology, die anwendungsfähigen Produkte von Lanzhou vor, darunter:

AI-Dokumentenverständnis: Abdeckung professioneller The Funktionen zum Parsen von PDF-Dokumenten und zur Informationsextraktion bieten bessere grundlegende Funktionen für das Dokumentenverständnis in der RAG-Lösung Benutzer können mehrere Dokumente als Referenzmaterialien hochladen, unterstützen benutzerdefinierte mehrstufige Fragen und das Schreiben von Gliederungen und werden durch große Modelle in die Lage versetzt, bei Bedarf automatisch vollständige erste Entwürfe von Artikeln zu erstellen Sprachen und professionelle Übersetzung in mehr als 20 Bereichen;

Lanzhou Intelligence: ein Produkt, das sich auf die intelligente Analyse und Frage und Antwort von Besprechungsinhalten konzentriert. Es handelt sich um einen großen modellbasierten intelligenten Besprechungsassistenten, der auf großen Modellen basiert

Lanzhou AI Suche: Eine Suchmaschine im Zeitalter großer Sprachmodelle.

Im vergangenen Jahr hat sich der Bereich der Großmodelle von Tag zu Tag verändert.

Wir werden alles tun, was OpenAI tut. Kurzfristig ist es in Ordnung, aber nicht auf lange Sicht. Wir müssen unsere eigenen innovativen Ideen haben.

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣 Zhou Ming brachte seine Ansichten darüber zum Ausdruck, wie man Stärken nutzen und Schwächen vermeiden und seinen eigenen, einzigartigen Weg der Innovation finden kann.

Der wichtigste erste Schritt ist eine klare Positionierung des Unternehmens. Die Positionierung von Lanzhou Technology unterscheidet sich deutlich von anderen großen Modell-Startups in China.

Lanzhou ist beispielsweise als umfassendes Unternehmen positioniert, das „Großmodelltechnologie + Unternehmensszenarioanwendung“ anbietet. „Wir hoffen, Anwendungen aus technischer Sicht und Technologie am besten aus Anwendungsperspektive zu verstehen. Gleichzeitig sind wir hoffen, dass Technologie und Anwendungen eine ökologische Verbindung eingehen, die es beiden Parteien ermöglicht, schnell zu iterieren. „

Gleichzeitig ist es weiterhin notwendig, sich auf die Umsetzung zu konzentrieren – um durch die Umsetzung Werte zu schaffen und Innovationen voranzutreiben.“

Und es ist zu beachten, dass Innovation und Umsetzung sich ergänzen.

Innovieren oder implementieren Sie nicht blindlings, sondern verbinden Sie beides, um eine schnelle Iteration zu ermöglichen.

Abschließend erinnerte ihn Zhou Ming auch aufrichtig daran:

Dies ist das erste Jahr, in dem große Modelle auf den Markt gebracht werden, also gibt es überall Gold, oder? Nein, ich kann mit gutem Gewissen sagen, dass wir nicht viele Orte erkundet haben.

Wie löst man beispielsweise die letzte Meile der Landung eines großen Modells? Was ist das Geschäftsmodell des großen Modells? Wie kann die Lieferfähigkeit gestärkt werden? Wie kann die Produktvermarktung verbessert werden?

Die Umsetzung des großen Modells hat eigentlich gerade erst begonnen.

– Kontaktieren Sie den Autor –

Das obige ist der detaillierte Inhalt vonLanzhou besteht darauf, alle Anstrengungen zu unternehmen: Um die ToB-Szene umzusetzen, reicht ein großes Modell mit 10B-Parametern. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:myzaker.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen