3년 동안 16개의 기사, 전 구글 연구 과학자 Yi Tay가 Gemini Pro에 필적하는 새로운 모델인 21B, GPT-3.5를 공식 발표했습니다.-일체 포함-php.cn

집

기술 주변기기

일체 포함

3년 동안 16개의 기사, 전 구글 연구 과학자 Yi Tay가 Gemini Pro에 필적하는 새로운 모델인 21B, GPT-3.5를 공식 발표했습니다.

王林

Feb 15, 2024 pm 06:45 PM

산업rekayi tay

팀의 새로운 모델은 여러 벤치마크에서 Gemini Pro 및 GPT-3.5와 비슷합니다.

대형 AI 모델에 대한 논문을 자주 읽는다면 이태이는 친숙한 이름일 것입니다. Google Brain의 전 수석 연구 과학자인 Yi Tay는 PaLM, UL2, Flan-U-PaLM, LaMDA/Bard, ViT-22B, PaLI를 포함하여 잘 알려진 많은 대규모 언어 모델 및 다중 모드 모델에 기여했습니다. , 엄마 등.

Yi Tay의 프로필 통계에 따르면, 그는 Google Brain에서 3년 넘게 근무하면서 총 45편 정도의 논문 집필에 참여했으며 그 중 16편의 공동 저자입니다. 저자 논문에는 UL2, U-PaLM, DSI, Synthesizer, Charformer 및 Long Range Arena 등이 포함됩니다.

三年16篇一作，前谷歌研究科学家Yi Tay官宣新模型，21B媲美Gemini Pro、GPT-3.5

자신의 사업을 시작하기 위해 Google을 떠난 대부분의 Transformer 작가들과 마찬가지로 Yi Tay는 작년 3월 Google 퇴사를 발표하고 Reka라는 회사를 공동 창립했으며 회사의 수석 과학자로 활동하고 있습니다. -규모 언어 모델.

시간이 지남에 따라 Yi Tay는 새로운 모델을 출시했다고 방금 발표했습니다.

"SOTA 성능을 갖춘 새로운 21B 멀티 모드인 Reka Flash를 여러분과 공유하게 되어 기쁩니다. 역동적인 모델 이는 언어 및 시각적 벤치마크에서 Gemini Pro 및 GPT 3.5와 비슷합니다. 상대적으로 제한된 리소스로 이 모델을 처음부터 훈련했습니다... 한편, 가장 크고 강력한 모델인 Reka-Core도 곧 완성될 예정입니다. "

Reka Flash: 효율적인 다중 모달 언어 모델

Reka Flash의 매개변수 크기는 21B이며 완전히 처음부터 시작됩니다. 훈련 성능은 더 큰 것과 비슷합니다. 모델이며 Reka Flash는 수많은 언어 및 비전 벤치마크에서 Gemini Pro 및 GPT-3.5와 경쟁적입니다.

또한 Reka 팀은 매개변수가 7B에 불과하고 더 효율적이어서 리소스 제약 조건(예: 장치에서 로컬에서도 실행) 시나리오.

이 두 모델은 공개 테스트 단계에 있으며 관심 있는 독자들은 가서 시험해 볼 수 있다는 점을 언급할 가치가 있습니다.

평가판 주소: https://chat.reka.ai/auth/login

동시에 Reka 팀은 가장 크고 강력한 Reka Core 모델을 대중에게 공개할 것이라고 발표했습니다. 앞으로 몇 주 안에 출시될 예정입니다.

오픈소스 문제에 대해서는 아직 검토 중이라고 팀에서 밝혔습니다.

평가: 언어 

평가 벤치마크에는 MMLU(지식 기반 질문 답변), GSM8K(추론 및 수학), HumanEval(코드 생성) 및 GPQA(Google 인증 대학원 수준)가 포함됩니다. 질문 답변) .

결과에 따르면 Reka Flash는 MMLU 및 GPQA에서 Gemini Pro를 능가하고 GSM8K 및 HumanEval에서 경쟁력 있는 결과를 달성하는 등 벤치마크에서 매우 좋은 결과를 얻었습니다. 또한 이러한 평가에서 Reka Flash는 많은 대형 모델(예: Llama 2 70B, Grok-1, GPT-3.5)보다 훨씬 뛰어난 성능을 발휘합니다.

평가: 다국어 추론

Reka 32개 이상의 언어로 제공되는 플래시 텍스트(영어, 독일어, 중국어, 일본어, 프랑스어, 한국어, 스페인어, 이탈리아어, 아랍어 등 포함) Reka Flash에서는 Reka Flash가 강력한 다중 언어 모델로 간주될 수 있습니다. 연구원들은 다국어 상식 추론, 인과 추론, 질문 답변을 포함한 다국어 벤치마크에서 다양한 모델의 성능을 비교했습니다. 결과에 따르면 Reka Flash는 이러한 모든 작업에서 Llama-2 70B 및 Mixtral보다 성능이 뛰어납니다.

평가: 비전 및 비디오

또한 이 연구에서는 시각적 질문 답변(MMMU, VQA-v2), 비디오 자막(VATEX) 및 영상 질문과 답변(인식 테스트). 결과는 Reka Flash가 네 가지 벤치마크 모두에서 Gemini Pro와 경쟁력이 있음을 보여줍니다.

이 연구에서는 Reka Flash 기반 채팅 모델을 평가하기 위해 일련의 인간 평가도 수행했습니다. 연구원들은 1) 텍스트 전용 채팅 모델과 2) 다중 모드 채팅 모델이라는 두 가지 설정을 고려했습니다. 평가 과정에서 Askell et al.의 방법에 따라 ELO 점수와 전체 승률을 계산했습니다.

일반 텍스트 채팅: 연구원들은 GPT-4, Claude 2.1 및 Gemini Pro(API 버전)와 같은 주요 모델을 벤치마킹했습니다. 또한 연구원들은 Reka Edge, Mistral 7B 및 Llama 2 7B 채팅 모델의 성능도 비교했습니다.

인간 평가 결과 Reka Flash는 GPT-3.5 Turbo, Claude, Mixtral 및 Gemini Pro를 능가하는 경쟁력 있는 결과를 달성한 것으로 나타났습니다. Reka Edge는 다른 두 7B 모델보다 앞서 Claude Instant 1.2의 성능에 접근합니다. 🎙 비교해보세요. 결과는 Reka Flash가 GPT4-V를 제외한 모든 모델보다 성능이 우수하다는 것을 보여줍니다. Reka Edge도 Mistral 7B 기반 Llava 1.6 7B를 제치고 Gemini Pro의 성능에 근접하는 등 좋은 순위를 달성했습니다.

7B 매개변수가 포함된 Reka Edge 모델

Reka Edge는 온프레미스 배포 및 대기 시간에 민감한 애플리케이션을 위해 설계된 보다 컴팩트한 7B 모델입니다. 언어 평가 작업에서 이 연구는 비슷한 크기의 모델(예: Mistral 7B 및 Llama-2 7B)과의 비교를 보고합니다. 결과에 따르면 Reka Edge는 표준 언어 벤치마크에서 Llama 2 7B 및 Mistral 7B보다 성능이 뛰어납니다.

요약

Reka 팀은 가장 진보된 다중 모달 언어 모델을 구축하는 것을 목표로 하고 있으며 Reka Flash 및 Reka Edge의 출시로 AI 로드맵의 초기 이정표는 다음과 같습니다. 달성. 누구나 다음 연구를 기대할 수 있습니다.

참조 링크: https://reka.ai/reka-flash-an-efficient-and-capable-multimodal-언어-model/

위 내용은 3년 동안 16개의 기사, 전 구글 연구 과학자 Yi Tay가 Gemini Pro에 필적하는 새로운 모델인 21B, GPT-3.5를 공식 발표했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 机器之心에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

요리 혁신 요리 : 인공 지능이 식품 서비스를 변화시키는 방법Apr 12, 2025 pm 12:09 PM

AI 식품 준비 여전히 초기 사용 중이지만 AI 시스템은 음식 준비에 점점 더 많이 사용되고 있습니다. AI 구동 로봇은 부엌에서 햄버거를 뒤집기, 피자 만들기 또는 SA 조립과 같은 음식 준비 작업을 자동화하는 데 사용됩니다

파이썬 네임 스페이스 및 가변 범위에 대한 포괄적 인 안내서Apr 12, 2025 pm 12:00 PM

소개 파이썬 기능에서 변수의 네임 스페이스, 범위 및 동작을 이해하는 것은 효율적으로 작성하고 런타임 오류 또는 예외를 피하는 데 중요합니다. 이 기사에서는 다양한 ASP를 탐구 할 것입니다

비전 언어 모델 (VLMS)에 대한 포괄적 인 안내서Apr 12, 2025 am 11:58 AM

소개 생생한 그림과 조각으로 둘러싸인 아트 갤러리를 걷는 것을 상상해보십시오. 이제 각 작품에 질문을하고 의미있는 대답을 얻을 수 있다면 어떨까요? “어떤 이야기를하고 있습니까?

Mediatek은 Kompanio Ultra 및 Dimensity 9400으로 프리미엄 라인업을 향상시킵니다.Apr 12, 2025 am 11:52 AM

제품 케이던스를 계속하면서 이번 달 Mediatek은 새로운 Kompanio Ultra and Dimensity 9400을 포함한 일련의 발표를했습니다. 이 제품은 스마트 폰 용 칩을 포함하여 Mediatek 비즈니스의 전통적인 부분을 채우고 있습니다.

이번 주 AI : Walmart는 패션 트렌드를 설정하기 전에 패션 트렌드를 설정합니다.Apr 12, 2025 am 11:51 AM

#1 Google은 Agent2agent를 시작했습니다 이야기 : 월요일 아침입니다. AI 기반 채용 담당자로서 당신은 더 똑똑하지 않고 더 똑똑하지 않습니다. 휴대 전화에서 회사의 대시 보드에 로그인합니다. 세 가지 중요한 역할이 공급되고, 검증되며, 예정된 FO가 있음을 알려줍니다.

생성 AI는 사이코브블을 만난다Apr 12, 2025 am 11:50 AM

나는 당신이되어야한다고 생각합니다. 우리 모두는 Psychobabble이 다양한 심리적 용어를 혼합하고 종종 이해할 수 없거나 완전히 무의미한 모듬 채터로 구성되어 있다는 것을 알고 있습니다. 당신이 fo를 뿌리기 위해해야 할 일

프로토 타입 : 과학자들은 종이를 플라스틱으로 바꿉니다Apr 12, 2025 am 11:49 AM

이번 주 발표 된 새로운 연구에 따르면 2022 년에 제조 된 플라스틱의 9.5%만이 재활용 재료로 만들어졌습니다. 한편, 플라스틱은 계속해서 매립지와 생태계에 전 세계에 쌓이고 있습니다. 그러나 도움이 진행 중입니다. 엥인 팀

AI 분석가의 부상 : AI 혁명에서 이것이 가장 중요한 일이 될 수있는 이유Apr 12, 2025 am 11:41 AM

최근 Enterprise Analytics 플랫폼 Alteryx의 CEO 인 Andy MacMillan과의 대화는 AI 혁명 에서이 비판적이면서도 저평가 된 역할을 강조했습니다. MacMillan에서 설명했듯이 원시 비즈니스 데이터와 AI-Ready Informat의 격차

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.

SublimeText3 Linux 새 버전

SublimeText3 Linux 최신 버전

DVWA

DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는