>  기사  >  기술 주변기기  >  Wenxin 4.0은 SuperBench 평가에서 좋은 성적을 거두며 많은 지표에서 선두를 달리고 있습니다.

Wenxin 4.0은 SuperBench 평가에서 좋은 성적을 거두며 많은 지표에서 선두를 달리고 있습니다.

WBOY
WBOY앞으로
2024-04-23 13:37:06477검색

2024년 3월 칭화대학교 기초모델연구센터가 최근 발표한 '슈퍼벤치 대형모델 종합역량평가 보고서'에서는 국내외 영향력 있는 모델 14명을 종합평가했다.

이 보고서에서는 Wenian 4.0의 뛰어난 성능이 널리 주목을 받았습니다. 전체적인 성능은 해외 상위 모델에 가깝고, 세계 선두 모델과의 격차도 점차 좁혀져 국내 대표 모델로 자리매김하고 있음을 보여주고 있다.

Wenxin 4.0은 SuperBench 평가에서 좋은 성적을 거두며 많은 지표에서 선두를 달리고 있습니다.

인간 정렬 능력 평가에서 Text 4.0은 뛰어난 강점을 보여 의심의 여지 없이 국내 1위를 차지했습니다. 동시에 중국어 추론 및 중국어 능력 평가에서도 Text 4.0이 다른 모델과 비교하여 가장 우수합니다. 특히 중국어 이해도 평가에서는 Text 4.0의 점수가 2위인 GLM-4보다 0.41점 더 높아 중국어 처리에 있어 탄탄한 실력을 보여주고 있다.

의미론적 이해를 위한 수학적 능력 평가에서는 Text 4.0과 Claude-3 모델이 세계 공동 1위를 차지했으며, 잘 알려진 GPT-4 시리즈 모델이 바짝 뒤따르며 4위와 5위를 차지했습니다. 다른 모델의 점수는 대부분 55점 내외에 집중되어 있으며, 선두그룹 간 격차가 상당합니다.

Wenxin 4.0은 SuperBench 평가에서 좋은 성적을 거두며 많은 지표에서 선두를 달리고 있습니다.

독해력 평가에서는 Wenxin 4.0도 빛을 발합니다. GPT-4 Turbo와 Claude-3를 능가했을 뿐만 아니라 GLM-4도 능가하며 최고 점수를 달성했습니다.

기업이 가장 우려하는 보안 평가에서도 Text GPT 4.0이 우수한 성능을 보였습니다. 세계 최고 수준의 GPT-4 시리즈 모델과 Claude-3를 제치고 89.1점이라는 높은 점수를 기록했습니다. 이 리뷰에서는 Claude-3가 4위를 차지한 반면, Claude-3는 1위를 차지했습니다.

원신이옌은 지난해 3월 16일 공개 데뷔한 이후 단시간에 이용자 수 돌파를 달성해 현재 2억 명 이상의 이용자를 보유하고 있다고 보고서에서도 언급했다. 동시에 일일 API 호출 수도 2억 회를 초과할 정도로 매우 활발합니다.

위 내용은 Wenxin 4.0은 SuperBench 평가에서 좋은 성적을 거두며 많은 지표에서 선두를 달리고 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 itbear.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제