Heim >Technologie-Peripheriegeräte >KI >Mit Hunderten von Milliarden Parametern hat sich Alibaba Cloud Tongyi Qianwen zu 2.0 entwickelt: Die Leistung übertrifft GPT-3.5 und beschleunigt, um GPT-4 einzuholen

Mit Hunderten von Milliarden Parametern hat sich Alibaba Cloud Tongyi Qianwen zu 2.0 entwickelt: Die Leistung übertrifft GPT-3.5 und beschleunigt, um GPT-4 einzuholen

王林nach vorne: 2023-10-31 18:17:131068Durchsuche

Alibaba Cloud hat am 31. Oktober offiziell Tongyi Qianwen 2.0 veröffentlicht, ein großes Modell mit Hunderten Milliarden Parametern. Laut 10 maßgeblichen Bewertungsergebnissen übersteigt die Gesamtleistung von Tongyi Qianwen 2.0 GPT-3,5 und holt GPT-4 schnell ein. Am selben Tag wurde die Tongyi Qianwen APP in den wichtigsten Märkten für mobile Anwendungen eingeführt. Über die APP kann jeder die Funktionen des neuesten Modells direkt erleben.

In den letzten 6 Monaten hat Tongyi Qianwen 2.0 im Vergleich zu 4 Die im März veröffentlichte Version 1.0 von Tongyi Qianwen 2.0 hat seine Fähigkeiten in den Bereichen komplexes Befehlsverständnis, literarisches Schaffen, allgemeine Mathematik, Wissensgedächtnis und Halluzinationsresistenz erheblich verbessert. Derzeit hat die Gesamtleistung von Tongyi Qianwen GPT-3,5 überschritten und beschleunigt, um GPT-4 einzuholen.

Die umfassende Leistung von Tongyi Qianwen 2.0 übertrifft GPT-3.5 und holt immer schneller zu GPT-4 auf

In 10 gängigen Benchmark-Bewertungssätzen wie MMLU, C-Eval, GSM8K, HumanEval und MATH hat es bestanden. Die Gesamtpunktzahl von Yiqianwen 2.0 übertrifft Metas Llama-2-70B, es hat neun Siege und eine Niederlage. Im Vergleich zu GPT-4 hat es vier Siege und sechs Niederlagen mit GPT-4 hat sich weiter verengt

Die Fähigkeit, Chinesisch und Englisch zu verstehen, ist die Grundkompetenz großer Sprachmodelle. Bei den englischen Aufgaben erzielte Tongyi Qianwen 2.0 im MMLU-Benchmark den zweiten Platz nach GPT-4. Durch die deutliche Erhöhung der Anzahl der Parameter kann Tongyi Qianwen 2.0 komplexe Sprachstrukturen und -konzepte besser verstehen und verarbeiten , Tongyi Qianwen 2.0 erreichte die höchste Punktzahl im C-Eval-Benchmark mit einem klaren Vorteil. Dies liegt daran, dass das Modell während des Trainings mehr Chinesisch-Korpus gelernt hat, wodurch sein Chinesisch-Verständnis und seine Ausdrucksfähigkeiten weiter gestärkt wurden.

In Bereichen wie mathematischem Denken und Codeverständnis hat Tongyi Qianwen 2.0 erhebliche Fortschritte gemacht. Im Argumentations-Benchmark-Test GSM8K belegte Tongyi Qianwen den zweiten Platz und demonstrierte starke Rechen- und logische Denkfähigkeiten. Im HumanEval-Test lag Tongyi Qianwens Punktzahl dicht hinter GPT-4 und GPT-3.5, was hauptsächlich die Fähigkeit des Modells misst Das Verstehen und Ausführen von Codefragmenten ist die Grundlage für große Modelle, die in Szenarien wie Programmierunterstützung und automatischer Codereparatur verwendet werden.

Mit Hunderten von Milliarden Parametern hat sich Alibaba Cloud Tongyi Qianwen zu 2.0 entwickelt: Die Leistung übertrifft GPT-3.5 und beschleunigt, um GPT-4 einzuholen

Tongyi Qianwen 2.0 veröffentlicht

Tongyi Qianwen ist ausgereifter und einfacher zu bedienen. Tongyi Qianwen 2.0 hat technische Optimierungen in Bezug auf die Einhaltung von Anweisungen, die Verwendung von Werkzeugen, die verfeinerte Erstellung usw. vorgenommen, sodass es besser in nachgelagerte Anwendungsszenarien integriert werden kann. Auf der offiziellen Website von Tongyi Large Model wurden multimodale und Plug-in-Funktionen eingeführt, die segmentierte Aufgaben wie Bildeingabe und Dokumentanalyse unterstützen.

Gleichzeitig wurden acht große Branchenmodellgruppen gegründet, die auf der Tongyi-Großmodellschulung basieren: Tongyi Lingma – intelligenter Codierungsassistent, Tongyi Zhiwen – KI-Leseassistent, Tongyi Listening – Arbeits- und Lern-KI-Assistent, Tongyi Stardust –. personalisierte Plattform zur Charaktererstellung, Tongyi Midianjin – intelligenter Investment-Research-Assistent, Tongyi Xiaomi – intelligenter Kundenservice, Tongyi Renxin – persönlicher exklusiver Gesundheitsassistent, Tongyi Farui – KI-Rechtsberater. Die 8 wichtigsten Branchenmodelle sind für die gängigsten vertikalen Szenarien konzipiert und werden speziell anhand von Domänendaten trainiert. Benutzer können Modellfunktionen direkt auf der offiziellen Website erleben, und Entwickler können Modellfunktionen durch Webseiteneinbettung, API/SDK-Aufrufe usw. in ihre eigenen großen Modellanwendungen und -dienste integrieren.

Mit Hunderten von Milliarden Parametern hat sich Alibaba Cloud Tongyi Qianwen zu 2.0 entwickelt: Die Leistung übertrifft GPT-3.5 und beschleunigt, um GPT-4 einzuholen

Die Tongyi-Großmodellfamilie wurde vollständig aktualisiert und 8 große Branchenmodellgruppen wurden eingeführt

Seit Oktober hat Alibaba Cloud eine intensive Zusammenarbeit mit führenden Partnern in mehr als 60 Branchen durchgeführt , Förderung von General Qianwen in praktischen Anwendungen in den Bereichen Büro, Kulturtourismus, Elektrizität, Regierungsangelegenheiten, Krankenversicherung, Transport, Fertigung, Finanzen, Softwareentwicklung und anderen Bereichen

Zhou Jingren sagte, dass Alibaba Cloud plant, die 72B-Version von Tongyi als Open Source bereitzustellen Qianwen in naher Zukunft. Zuvor hat Alibaba Cloud die 7B- und 14B-Versionen des Modells als Open-Source-Version bereitgestellt, und die Gesamtzahl der Downloads dieser Modelle liegt bei über 1 Million. Alibaba Cloud wird weiterhin Entwickler in verschiedenen Branchen dabei unterstützen, das Open-Source-Modell von Tongyi Qianwen zur Entwicklung innovativer Modelle und Anwendungen zu nutzen. Tongyi Qianwen 72B wird bald Open Source sein

Das obige ist der detaillierte Inhalt vonMit Hunderten von Milliarden Parametern hat sich Alibaba Cloud Tongyi Qianwen zu 2.0 entwickelt: Die Leistung übertrifft GPT-3.5 und beschleunigt, um GPT-4 einzuholen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

math gpt llama

Stellungnahme：

Dieser Artikel ist reproduziert unter:jiqizhixin.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen

Vorheriger Artikel：Die Debüts der Apple M3-Serie mit doppelter Leistung, M1 und M2 sind zu den Tränen der Zeit gewordenNächster Artikel：Die Debüts der Apple M3-Serie mit doppelter Leistung, M1 und M2 sind zu den Tränen der Zeit geworden

In Verbindung stehende Artikel

Mehr sehen