집 >기술 주변기기 >일체 포함 >Gemini-1.5-Pro 및 GPT-4V를 물리치고 대형 모델 다중 모드 기능에서 세계 3위 안에 들었습니다.

Gemini-1.5-Pro 및 GPT-4V를 물리치고 대형 모델 다중 모드 기능에서 세계 3위 안에 들었습니다.

PHPz원래의: 2024-06-29 00:25:011130검색

최근 윤총기술의 대형 모델은 권위 있는 종합 평가 플랫폼인 OpenCompass의 다중 모달 평가 분야에서 상당한 진전을 이루었습니다. 최신 평가 결과에 따르면 이 시스템에서 Yuncong Technology의 Congrong 대형 모델의 평균 점수는 65.5점으로 나타났습니다. 이 결과로 Congrong 대형 모델은 Google의 Gemini-1.5-Pro 및 GPT-4v를 제치고 세계 3위 안에 들었습니다. GPT-4o(69.9)와 Claude3.5-Sonnet(67.9)에서 2위를 기록했습니다. 국내 시장에서도 대형 모델의 성능이 InternVL-Chat(61.7)과 GLM-4V(60.8)를 제치고 1위를 차지했다.

1. OpenCompass 다중 모드 목록

OpenCompass 대형 모델 개방형 평가 시스템은 Shanghai Artificial Intelligence Laboratory에서 출시한 완전한 오픈 소스이자 재현 가능한 평가 프레임워크입니다.
OpenCompass 다중 모드 평가는 8개의 대표 데이터 세트를 사용하여 다중 모드 대형 모델의 기능을 다양한 관점에서 객관적으로 수량화하고 차원 적용 범위를 평가합니다.
- 대상 탐지
- 텍스트 인식
- 동작 인식
- 이미지 이해 and Relational Reasoning
- Art and Design
- Business
- Science
- Health and Medicine
- Humanities and Social Sciences
- Technology and Engineering
- Mathematical Reasoning
  그림 2: Calm Large Model-2.0 다중 모드의 예 Capability

이번 평가에서 Congrong 대형 모델은 6개 데이터 세트에서 좋은 성능을 발휘하여 국내 1위(MMbench, MMStar, MathVista, HallusionBench, AI2D, OCRBench)를 기록했으며, 특히 OCRBench 테스트 세트에서, 827점(1000점 만점)으로 세계 최고 점수를 달성했으며, 2위인 GLM-4v보다 13점이나 높아 텍스트 인식, 텍스트 중심 시각적 질문에서 잔잔한 대형 모델의 능력을 더욱 향상시켰다. 시각적 질문 답변, 핵심 정보 추출 등 비즈니스 시나리오에 적용 가능합니다.

Gemini-1.5-Pro 및 GPT-4V를 물리치고 대형 모델 다중 모드 기능에서 세계 3위 안에 들었습니다.

그림 3: OpenCompass China의 대형 모델 기능 시연

이 시스템에서 Rongrong 대형 모델의 뛰어난 성능은 효율적인 멀티모달 모달을 달성하기 위해 Yuncong Technology가 자체 개발한 효율적인 멀티모달 처리 아키텍처와 고급 컴퓨팅 기술에 의존합니다. 데이터 처리 기능은 시각적 작업과 언어 작업 간의 효율적인 융합 및 전환을 달성할 수 있으며, 컴퓨팅 리소스의 사용을 극대화하여 대규모 다중 모드 데이터 처리 시 높은 성능과 응답 속도를 유지할 수 있도록 모델을 만드는 훈련 프로세스는 다음과 같습니다. 더 효율적일수록 수렴 속도는 더 빠르고 성능은 더 안정적입니다.

동시에 윤총기술의 시각과 언어 분야에서의 장기적인 심층 축적과 지속적인 혁신의 혜택도 누리고 있습니다. ㅋㅋ ~ 2.0 다중 모드 기능 예, 세계 상위 5위 안에 들었습니다.

Gemini-1.5-Pro 및 GPT-4V를 물리치고 대형 모델 다중 모드 기능에서 세계 3위 안에 들었습니다.

인간-기계 협업 기술 연구개발에 주력하는 플랫폼 기업으로

윤콩테크놀로지

는

AI 에이전트 및 대형 모델 기술의 개발 및 적용을 적극적으로 추진해 왔습니다. 인공지능 기술의 급속한 발전으로 멀티모달 대형 모델은 산업 변화를 이끄는 핵심 엔진이 되었습니다. OpenCompass 대형 모델 개방형 평가 시스템에서 Rongrong 모델의 뛰어난 성능은 Yuncong Technology

의 기술 혁신 강점을 인정할 뿐만 아니라 업계에 모범이 되며 새로운 라운드에서 글로벌 기술 기업에 영감을 줍니다. 인공 지능의 최고 수준에 도달하세요.

위 내용은 Gemini-1.5-Pro 및 GPT-4V를 물리치고 대형 모델 다중 모드 기능에서 세계 3위 안에 들었습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

架构人工智能 gpt

성명：

이전 기사：Bengio 팀은 Claude 3.5 및 GPT-4o의 약점을 겨냥한 새로운 다중 모드 벤치마크를 제안합니다.다음 기사：Bengio 팀은 Claude 3.5 및 GPT-4o의 약점을 겨냥한 새로운 다중 모드 벤치마크를 제안합니다.

Gemini-1.5-Pro ​​및 GPT-4V를 물리치고 대형 모델 다중 모드 기능에서 세계 3위 안에 들었습니다.

관련 기사

Gemini-1.5-Pro 및 GPT-4V를 물리치고 대형 모델 다중 모드 기능에서 세계 3위 안에 들었습니다.