Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  Die neuen großen Modelle der Kunlun Wanwei „Tiangong“ 13B-Serie können problemlos und ohne Schwellen kommerzialisiert werden.

Die neuen großen Modelle der Kunlun Wanwei „Tiangong“ 13B-Serie können problemlos und ohne Schwellen kommerzialisiert werden.

WBOY
WBOYnach vorne
2023-10-30 15:41:171293Durchsuche

Am 30. Oktober kündigte Kunlun Wanwei die Open Source der Skywork-13B-Serie von Skywork-13B an, einem großen Sprachmodell im zweistelligen Milliardenbereich und seltenen Open Source von 600 GB, 150 B Tokens Ein sehr großer hochwertiger chinesischer Open-Source-Datensatz.

Die Kunlun Wanwei Skywork-13B-Serie umfasst derzeit zwei Hauptmodelle mit 13 Milliarden Parametern: Skywork-13B-BaseModell, Skywork-13B-MathModell, sie sind in CEVAL, GSM8K und Viele andere maßgebliche Bewertungen und Benchmark-Tests haben die besten Ergebnisse von Modellen gleicher Größe gezeigt. Seine Chinesischen Fähigkeiten sind besonders herausragend und seine Leistung in chinesischer Technologie, Finanzen, Regierungsangelegenheiten und anderen Bereichen ist höher als bei anderen Open Source Modelle.

Die Download-Adresse für Skywork-13B (Model Scope) ist verfügbar unter: https://modelscope.cn/organization/skywork

Die Download-Adresse für Skywork-13B (Github): https://github.com/SkyworkAI /Skywork

Zusätzlich zum Open-Source-Modell wird die Skywork-13B-Serie großer Modelle auch Open-Source sein 600 GB, 150B Tokenshochwertiger chinesischer Korpusdatensatz Skypile/Chinese-Web-Text- 150B, dies ist derzeit einer der größten chinesischen Open-Source-Datensätze.

Gleichzeitig wird Kunlun Wanweis „Skywork“ Skywork-13B große Modellserie bald vollständig für die kommerzielle Nutzung geöffnet sein——Entwickler müssen sich nicht für die kommerzielle Nutzung bewerben.

13 Milliarden Parameter, zwei Hauptmodelle, einer der größten chinesischen Datensätze, vollständig offen für die kommerzielle Nutzung. Kunlun Wanweis „Skywork“ Skywork-13B Serie großer Modelle kann als die umfassendste Open-Source-Kommerziellmodellreihe mit hoher Qualität im Wert von mehreren zehn Milliarden der Branche bezeichnet werden.

Der Open Source der Skywork-13B-Serie großer Modelle bietet die beste technische Unterstützung für die Anwendung großer Modelle und die Entwicklung der Open-Source-Community, senkt die kommerzielle Schwelle für große Modelle und fördert die Implementierung künstlicher Intelligenz Technologie in verschiedenen Branchen und Beitrag zum Aufbau des Ökosystems der künstlichen Intelligenz. Wir werden mit der Open-Source-Community zusammenarbeiten, um die unbekannte Welt zu erforschen und eine bessere Zukunft zu schaffen.

Die Skywork-13B-Serie von Kunlun umfasst zwei Hauptmodelle und ein 150B hochwertiger chinesischer Datensatz.

Skywork-13B-BaseDas Modell ist das Basismodell von Skywork-13B. Es wird mit 3,2 Billionen mehrsprachigen, hochwertigen Daten trainiert und hat bei CEVAL, CMMLU, MMLU, GSM8K und anderen Auswertungen die gleiche Leistung gezeigt und Benchmark-Tests. Beste Ergebnisse für maßstabsgetreue Modelle.

Skywork-13B-Math

Das Modell wurde speziell zur Stärkung der mathematischen Fähigkeiten trainiert und hat bei Datensätzen wie GSM8K die besten Ergebnisse von Modellen gleicher Größe erzielt.

  • Skypile/Chinese-Web-Text-150BDatensatz. Bei diesem Datensatz handelt es sich um hochwertige Daten, die gemäß unserem sorgfältig gefilterten Datenverarbeitungsprozess aus chinesischen Webseiten gefiltert wurden. Die Größe dieses Open-Source-Datensatzes beträgt ungefähr
  • 600 GB und die Gesamtzahl der
  • Token beträgt ungefähr (1500 Milliarden). Es ist derzeit einer der größten Open-Source-Datensätze in China . Darüber hinaus werden in der Skywork-13B-Reihe auch die im Modell verwendeten Bewertungsmethoden, Datenverhältnisforschung und Optimierungspläne für die Trainingsinfrastruktur offengelegt. Es besteht die Hoffnung, dass diese Open-Source-Inhalte das Verständnis der Community für Großprojekte weiter anregen können. Skalieren Sie das Modell vor dem Training und fördern Sie die Verwirklichung der künstlichen allgemeinen Intelligenz (AGI). usw. Maßgebliche Bewertungen und Benchmark-Tests haben die besten Ergebnisse von Modellen derselben Größenordnung gezeigt. Seine chinesischen Fähigkeiten sind besonders herausragend, und seine Leistung in den Bereichen chinesische Technologie, Finanzen, Regierungsangelegenheiten und andere ist höher als bei anderen Open-Source-Modellen. Fünf Merkmale der Modelle der Skywork-13B-Serie: Stärkste Parameterleistung: Große Modelle im gleichen Maßstab umfassend übertreffen

Dieses Open-Source-Modell der Skywork-13B-Serie bietet eine starke Leistung in CEVAL, CMMLU, MMLU, GSM8K und anderen wichtigen maßgeblichen Bewertungsbenchmarks übertrifft es Open-Source-Großmodelle wie LLaMA2-13B bei weitem und erzielt die besten Ergebnisse unter großen Modellen im gleichen Maßstab. (Datenstand: 25. Oktober)

Maximale Trainingsdaten:

3.2T

Hochwertige mehrsprachige Trainingsdaten

Große Modelle der Skywork-13B-Serie verfügen über 13 Milliarden Parameter und 3,2 Billionen hochwertige Mehrsprachigkeit Trainingsdaten. Die Generierungsfähigkeit, die kreative Fähigkeit und die Fähigkeit zum mathematischen Denken des Modells wurden erheblich verbessert.

Die stärkste Fähigkeit zur Modellierung chinesischer Sprache: Die Ratlosigkeitsbewertung der Modellierung chinesischer Sprache übertrifft alle chinesischen Open-Source-Modelle.

Die großen Modelle der Skywork-13B-Serie eignen sich hervorragend für die Modellierung chinesischer Sprache und verfügen über hervorragende Fähigkeiten zur Schaffung chinesischer Kultur. Bei der Bewertung im Bereich der chinesischen Texterstellung haben die Großmodelle der Skywork-13B-Serie herausragende Fähigkeiten bewiesen, insbesondere in den Bereichen Technologie, Finanzen, Regierungsangelegenheiten, Unternehmensdienstleistungen, kulturelle Kreativität, Spiele usw., und ihre Leistung ist besser als andere Open-Source-Modelle

Die neuen großen Modelle der Kunlun Wanwei „Tiangong“ 13B-Serie können problemlos und ohne Schwellen kommerzialisiert werden.

Die Abbildung zeigt die Verwirrung des Bewertungsmodells unter Daten in verschiedenen Bereichen. Je niedriger der Wert, desto stärker ist die Modellierungsfähigkeit des Modells in diesem Bereich. Die Ergebnisse zeigen, dass Tiangong 13B in technischen Artikeln, Filmen, Regierungsberichten, Spielen, Finanzen und allgemeinen Bereichen gut abschneidet

Skywork – Die 13B-Serie wird mit dem hochwertigen chinesischen Open-Source-Korpusdatensatz Skypile/Chinese-Web-Text-150B mit 600 GB und 150 B-Tokens ausgestattet, der derzeit einer der größten chinesischen Open-Source-Datensätze ist. Entwickler können in größtmöglichem Umfang auf den großen Modell-Vortrainingsprozess und die Erfahrung im technischen Bericht zurückgreifen, Modellparameter tiefgreifend anpassen und gezielte Schulungen und Optimierungen durchführen. Die aufrichtigste kommerzielle Open-Source-Nutzung: Für die kommerzielle Nutzung ist keine Anwendung erforderlichDerzeit sind in der Open-Source-Community die meisten chinesischen Modelle nicht vollständig für die kommerzielle Nutzung verfügbar. Normalerweise müssen Benutzer in der Open-Source-Community einen umständlichen Prozess zur Beantragung einer kommerziellen Lizenz durchlaufen. In einigen Fällen wird die Erteilung kommerzieller Lizenzen auch klar durch die Größe des Unternehmens, die Branche, die Anzahl der Benutzer usw. festgelegt und es ist keine Genehmigung zulässig.

Kunlun Wanwei legt großen Wert auf die Offenheit und Kommerzialisierung des Skyworks. 13B-Serie von Open Source, um den Autorisierungsprozess zu vereinfachen und Einschränkungen hinsichtlich Branche, Unternehmensgröße, Benutzern usw. aufzuheben, mit dem Ziel, mehr Benutzer und Unternehmen, die an chinesischen Großmodellen interessiert sind, dabei zu helfen, die Branche weiter zu erforschen und voranzutreiben.

Großformatige Modelle der Skywork-13B-Serie sind jetzt vollständig für die kommerzielle Nutzung lizenziert. Benutzer müssen nur das Modell herunterladen und der „Skywork Model Community License Agreement“ zustimmen und diese einhalten, um großformatige Modelle für kommerzielle Zwecke zu verwenden ohne erneut eine Genehmigung zu beantragen. Wir hoffen, dass Benutzer die technischen Möglichkeiten der Skywork-13B-Serie von Großmodellen leichter erkunden und kommerzielle Anwendungen in verschiedenen Szenarien erkunden können.

Fördern Sie den Wohlstand des Open-Source-Ökosystems und ermöglichen Sie mehr Entwicklern, an der Technologie von teilzunehmen

AIGC

Während der Entwicklung fördern wir technologische Verbesserungen durch gemeinsame Kreation und Austausch.

Im Zeitalter der KI boomt das ökologische Open-Source-Bauen und ist zu einem wichtigen Bindeglied bei der Verwirklichung der Integration von KI und Anwendungen geworden. Durch die Senkung der Schwelle für Modellentwicklungs- und -nutzungskosten und die Maximierung des Austauschs technischer Fähigkeiten und Erfahrungen können mehr Unternehmen und Entwickler an diesem von KI vorangetriebenen technologischen Wandel teilhaben. Fang Han, Vorsitzender und CEO von Kunlun Wanwei, ist einer der ersten hochrangigen Open-Source-Experten, der am Aufbau des Open-Source-Ökosystems beteiligt war, und außerdem einer der Pioniere des chinesischen Linux-Open-Source. Der Open-Source-Geist und die Entwicklung der AIGC-Technologie werden perfekt in die Strategie von Kunlun Wanwei integriert Chinas erstes inländisches groß angelegtes Sprachmodell, das die Entstehung von Intelligenz wirklich erkennt – „Tiangong 3.5“ – und Einführung von Einladungstests. Am 19. Mai gab das Beijing Municipal Bureau of Economy and Information Technology die erste Reihe der „Mitgliederliste des Beijing General Artificial Intelligence Industry Innovation Partnership Program“ bekannt. Kunlun Wanwei wurde mit seinem hochmodernen Explorations- und Investitionslayout im AIGC-Feld zum ersten Beispielpartner und Investitionspartner. Am 23. August veröffentlichte Kunlun Technology das erste KI-Suchprodukt in China namens Tiangong AI SearchAm 1. September trat Professor Yan Shuicheng, ein internationaler Spitzenexperte auf dem Gebiet der Computervision und des maschinellen Lernens, offiziell Kunlun Technology bei. war zusammen mit Zhou Yahui, dem Gründer von Kunlun Technology, Co-CEO von Tiangong Intelligence und gleichzeitig Direktor des Kunlun Technology 2050 Global Research Institute, verantwortlich für die Erforschung modernster Technologien.

In der vom Tencent Youtu Lab und der Universität Xiamen durchgeführten multimodalen Evaluierung großer Sprachmodelle erreichte Kunlun Wanwei Tiangong Large Model am 5. September die erste umfassende Punktzahl.

Am 25. September kontrolliert Kunlun Wanwei offiziell Aijie Core und entwickelt KI-Chips. Heute hat die Kunlun Wanwei Group ihre feste Entschlossenheit unter Beweis gestellt, durch die Open-Source-Aktion der Skywork-13B-Serie großer Modelle weiter zu investieren. Im Jahr 2015 wurde das Unternehmen an der Shenzhen Stock Exchange notiert. Es begann im Gaming-Bereich und hat sich mittlerweile zu einem Unternehmen entwickelt, das diversifizierte Unternehmen wie AII In AGI und AIGC integriert. Nach mehr als zehnjähriger Entwicklung hat sich Kunlun Wanwei der Bereitstellung führender Internetprodukte und -dienste für globale Nutzer verschrieben. Derzeit erforscht das Unternehmen aktiv die unendlichen Möglichkeiten im Bereich der künstlichen Intelligenz. Mittlerweile hat Kunlun Technology nach und nach drei Hauptgeschäftsbereiche aufgebaut: AGI und AIGC, Informationsverbreitung und Metaverse im Ausland sowie Investitionen. Sein Geschäft umfasst mehr als 100 Länder und Regionen auf der ganzen Welt, und die weltweite durchschnittliche monatliche aktive Nutzerzahl liegt bei fast 400 Millionen

Mit seiner fortschrittlichen Vorhersage technologischer Entwicklungstrends hat Kunlun Technology bereits im Jahr 2020 damit begonnen, das AIGC-Feld einzusetzen. Bisher hat Kunlun Wanwei fast drei Jahre einschlägige Erfahrung in der technischen Forschung und Entwicklung gesammelt und branchenführende umfassende Verarbeitungskapazitäten für Pre-Training-Daten aufgebaut KI-Großmodelle, KI-Suche, KI Mit sechs großen KI-Geschäftsmatrizen: Spiele, KI-Musik, KI-Animation und KI-Social-Networking ist es eines der inländischen Unternehmen mit den stärksten Modelltechnologie- und Engineering-Fähigkeiten, dem umfassendsten Layout und engagiert sich voll und ganz für den Aufbau von Open-Source-Communities.

Das obige ist der detaillierte Inhalt vonDie neuen großen Modelle der Kunlun Wanwei „Tiangong“ 13B-Serie können problemlos und ohne Schwellen kommerzialisiert werden.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:jiqizhixin.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen