Heim >Technologie-Peripheriegeräte >IT Industrie >Wenxin 4.0 schnitt in der SuperBench-Bewertung gut ab und lag bei vielen Indikatoren vorne

Wenxin 4.0 schnitt in der SuperBench-Bewertung gut ab und lag bei vielen Indikatoren vorne

WBOY
WBOYnach vorne
2024-04-23 13:37:06531Durchsuche

Im März 2024 wurden im kürzlich vom Basic Model Research Center der Tsinghua-Universität veröffentlichten „SuperBench Large Model Comprehensive Capability Evaluation Report“ 14 einflussreiche Modelle im In- und Ausland umfassend bewertet.

In diesem Bericht hat die herausragende Leistung von Wenian 4.0 große Aufmerksamkeit erregt. Seine Gesamtleistung liegt nahe an den internationalen Spitzenmodellen, und der Abstand zu den weltweit führenden Modellen verringert sich allmählich, was zeigt, dass es zum führenden inländischen Modell geworden ist.

Wenxin 4.0 schnitt in der SuperBench-Bewertung gut ab und lag bei vielen Indikatoren vorne

Bei der Bewertung der menschlichen Ausrichtungsfähigkeit zeigte Text 4.0 herausragende Stärke und belegte ohne Zweifel den ersten Platz im Land. Gleichzeitig schneidet Text 4.0 auch bei der Bewertung des chinesischen Denkens und der chinesischen Sprachkenntnisse am besten ab. Im Vergleich zu anderen Modellen liegen seine Vorteile auf der Hand. Insbesondere bei der Bewertung des Chinesischverständnisses liegt die Punktzahl von Text 4.0 um 0,41 Punkte über der des zweitplatzierten GLM-4, was seine profunden Fähigkeiten in der Verarbeitung von Chinesisch zeigt.

Bei der Bewertung der mathematischen Fähigkeiten für das semantische Verständnis belegten die Modelle Text 4.0 und Claude-3 weltweit den ersten Platz, während die bekannten Modelle der GPT-4-Serie knapp dahinter auf den Plätzen vier und fünf folgten. Die Ergebnisse anderer Modelle konzentrieren sich meist auf etwa 55 Punkte, wobei zwischen den Spitzengruppen ein erheblicher Abstand besteht.

Wenxin 4.0 schnitt in der SuperBench-Bewertung gut ab und lag bei vielen Indikatoren vorne

Bei der Bewertung der Leseverständnisfähigkeit glänzt Wenxin 4.0 ebenfalls. Es übertraf nicht nur GPT-4 Turbo und Claude-3, sondern auch GLM-4 und erreichte die höchste Punktzahl.

Bei der Sicherheitsbewertung, die Unternehmen am meisten am Herzen liegt, zeigte Text GPT 4.0 ebenfalls eine hervorragende Leistung. Es erreichte eine hohe Punktzahl von 89,1 Punkten und übertraf damit die Weltklassemodelle GPT-4 und Claude-3. belegte den ersten Platz, während Claude-3 in dieser Rezension nur den vierten Platz belegte.

In dem Bericht wurde auch erwähnt, dass Wenxinyiyan seit seinem öffentlichen Debüt am 16. März letzten Jahres in kurzer Zeit einen Durchbruch bei der Anzahl der Benutzer erzielt hat und derzeit mehr als 200 Millionen Benutzer hat. Gleichzeitig ist auch die Anzahl der täglichen API-Aufrufe äußerst aktiv und übersteigt 200 Millionen Mal.

Das obige ist der detaillierte Inhalt vonWenxin 4.0 schnitt in der SuperBench-Bewertung gut ab und lag bei vielen Indikatoren vorne. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:itbear.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen