11일 간의 오픈 소스 이후 Musk는 Grok-1.5를 다시 출시하여 128K 코드가 GPT-4를 물리쳤습니다!-일체 포함-php.cn

집

기술 주변기기

일체 포함

11일 간의 오픈 소스 이후 Musk는 Grok-1.5를 다시 출시하여 128K 코드가 GPT-4를 물리쳤습니다!

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Mar 30, 2024 am 08:01 AM

데이터기차

Grok-1이 오픈소스로 정식 발표된 지 반달만에 새롭게 업그레이드된 Grok-1.5가 출시되었습니다.

방금 Musk xAI는 128K 컨텍스트 Grok-1.5가 추론 기능을 크게 향상시켰다고 공식 발표했습니다.

그리고 곧 온라인에 공개될 예정입니다.

11일 간의 오픈 소스 이후 Musk는 Grok-1.5를 다시 출시하여 128K 코드가 GPT-4를 물리쳤습니다!

11일 전 Grok-1 모델의 무게와 아키텍처가 오픈 소스로 공개되어 Xai가 지난 11월 이전에 이룬 발전을 보여주었습니다.

Grok-1에는 Llama 2보다 4배 더 많은 3,140억 개의 매개변수가 있으며 MoE 아키텍처를 사용합니다. 전문가 8명 중 2명이 활동적인 전문가입니다.

11일 간의 오픈 소스 이후 Musk는 Grok-1.5를 다시 출시하여 128K 코드가 GPT-4를 물리쳤습니다!

Xai 소개, 즉 그 이후로 팀은 최신 모델 Grok-1.5의 추론 및 문제 해결 능력을 향상시켰습니다.

11일 간의 오픈 소스 이후 Musk는 Grok-1.5를 다시 출시하여 128K 코드가 GPT-4를 물리쳤습니다!

OpenAI의 전 개발자 관계 책임자는 xAI의 주요 출시 시기를 보면 그들의 속도와 긴박감을 알 수 있다고 말했습니다. 신나는!

11일 간의 오픈 소스 이후 Musk는 Grok-1.5를 다시 출시하여 128K 코드가 GPT-4를 물리쳤습니다!

128K 컨텍스트, Grok-1.5 수학적 추론 기능이 급증했습니다

공식 소개에 따르면 Grok-1.5는 컨텍스트 길이가 128K로 향상되었습니다.

11일 간의 오픈 소스 이후 Musk는 Grok-1.5를 다시 출시하여 128K 코드가 GPT-4를 물리쳤습니다!

Grok-1.5의 가장 중요한 개선 사항 중 하나는 코딩 및 수학 관련 작업의 성능입니다.

테스트에서 Grok-1.5는 수학 벤치마크에서 50.6%, GSM8K 벤치마크에서 90%를 달성했습니다. 이 두 수학 벤치마크는 초등학교부터 고등학교까지 다양한 경쟁 문제를 다루고 있습니다.

또한 Grok-1.5는 코드 생성 및 문제 해결 능력을 평가하는 HumanEval 벤치마크에서 74.1%의 높은 점수를 획득했습니다.

아래 그림에서 Grok-1과 비교하면 Grok-1.5의 수학 능력이 GSM8K에서는 62.9%에서 90으로, MATH에서는 23.9%에서 50.6%로 크게 향상되었음을 알 수 있습니다.

11일 간의 오픈 소스 이후 Musk는 Grok-1.5를 다시 출시하여 128K 코드가 GPT-4를 물리쳤습니다!

128K 긴 컨텍스트 이해, 16배 확장

Grok-1.5의 또 다른 새로운 기능은 컨텍스트 창 내에서 최대 128K 토큰의 텍스트를 처리할 수 있는 기능입니다.

이렇게 하면 Grok의 메모리 용량이 이전 컨텍스트 길이의 16배로 늘어나 더 긴 문서의 정보를 활용할 수 있습니다.

11일 간의 오픈 소스 이후 Musk는 Grok-1.5를 다시 출시하여 128K 코드가 GPT-4를 물리쳤습니다!

또한 새 모델은 컨텍스트 창이 확장되어도 지침을 따르는 기능을 유지하면서 더 길고 복잡한 프롬프트를 처리할 수 있습니다.

NIAH(Needle In A Haystack) 평가에서 Grok-1.5는 최대 128K 바이트 길이의 컨텍스트에 포함된 텍스트를 검색하는 강력한 검색 기능을 보여주었으며 완벽한 검색 결과를 달성했습니다.

Grok-1.5 인프라

Grok-1.5는 JAX, Rust 및 Kubernetes를 기반으로 하는 맞춤형 분산 교육 프레임워크를 기반으로 구축되었습니다.

이 교육 스택을 통해 xAI 팀은 최소한의 투자로 대규모 아이디어를 구축하고 새로운 아키텍처를 교육할 수 있습니다.

대규모 컴퓨팅 클러스터에서 LLM을 교육할 때 가장 큰 과제는 교육 작업의 안정성과 가동 시간을 극대화하는 것입니다.

xAI의 맞춤형 훈련 조정자는 문제가 있는 노드를 자동으로 감지하고 훈련 작업에서 제거하도록 보장합니다.

동시에 체크포인트, 데이터 로딩, 훈련 작업 재시작을 최적화하여 오류 발생 시 가동 중지 시간을 최소화했습니다.

xAI는 Grok-1.5가 모델 개선을 위해 곧 초기 테스터에게 제공될 것이라고 밝혔습니다.

또한 블로그에서는 Grok-1.5가 며칠 내에 출시될 몇 가지 새로운 기능을 미리 선보였습니다.

드디어 xAI가 언제나처럼 모집 정보를 올렸습니다.

11일 간의 오픈 소스 이후 Musk는 Grok-1.5를 다시 출시하여 128K 코드가 GPT-4를 물리쳤습니다!

위 내용은 11일 간의 오픈 소스 이후 Musk는 Grok-1.5를 다시 출시하여 128K 코드가 GPT-4를 물리쳤습니다!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

LM Studio를 사용하여 LLM을 로컬로 운영하는 방법은 무엇입니까? - 분석 VidhyaApr 19, 2025 am 11:38 AM

집에서 쉽게 대형 언어 모델 실행 : LM Studio User Guide 최근 몇 년 동안 소프트웨어 및 하드웨어의 발전으로 개인용 컴퓨터에서 LLM (Large Language Model)을 실행할 수있었습니다. LM Studio는이 프로세스를 쉽고 편리하게 만드는 훌륭한 도구입니다. 이 기사는 LM Studio를 사용하여 LLM을 로컬로 운영하는 방법, 주요 단계, 잠재적 문제 및 LLM의 이점을 현지에서 사용하는 방법에 따라 다릅니다. 당신이 기술 애호가이거나 최신 AI 기술에 대해 궁금하든이 가이드는 귀중한 통찰력과 실용적인 팁을 제공합니다. 시작합시다! 개요 LLM을 로컬로 실행하기위한 기본 요구 사항을 이해하십시오. 컴퓨터에 LM Studi를 설정하십시오

Guy Peri는 데이터 변환을 통해 McCormick의 미래를 도와줍니다Apr 19, 2025 am 11:35 AM

Guy Peri는 McCormick의 최고 정보 및 디지털 책임자입니다. Peri는 그의 역할에 7 개월 만에 회사의 디지털 기능에 대한 포괄적 인 변화를 빠르게 발전시키고 있습니다. 데이터 및 분석에 대한 그의 경력에 중점을 둡니다

신속한 엔지니어링에서 감정의 사슬은 무엇입니까? - 분석 VidhyaApr 19, 2025 am 11:33 AM

소개 인공 지능 (AI)은 인간의 손길로 반응하는 단어뿐만 아니라 감정을 이해하기 위해 진화하고 있습니다. 이 정교한 상호 작용은 빠르게 발전하는 AI 및 자연어 처리 분야에서 중요합니다. th

12 데이터 과학 워크 플로우를위한 최고의 AI 도구 - 분석 VidhyaApr 19, 2025 am 11:31 AM

소개 오늘날의 데이터 중심 세계에서 고급 AI 기술을 활용하는 것은 경쟁 우위와 효율성을 높이는 비즈니스에 중요합니다. 다양한 강력한 도구는 데이터 과학자, 분석가 및 개발자가 구축, Depl을 구축 할 수 있도록 힘을 실어줍니다.

AV 바이트 : OpenAi의 GPT-4O 미니 및 기타 AI 혁신Apr 19, 2025 am 11:30 AM

이번 주 AI 환경은 Openai, Mistral AI, Nvidia, Deepseek 및 Hugging Face와 같은 업계 대기업의 획기적인 릴리스로 폭발했습니다. 이 새로운 모델은 TR의 발전으로 인해 증가 된 전력, 경제성 및 접근성을 약속합니다.

Perplexity의 Android 앱은 보안 결함에 감염되어 있으며 보고서는Apr 19, 2025 am 11:24 AM

그러나 검색 기능뿐만 아니라 AI 보조원 역할을하는 회사의 Android 앱은 사용자에게 데이터 도난, 인수 및 악의적 인 공격에 노출 될 수있는 다양한 보안 문제로 가득 차 있습니다.

모두가 AI 사용에 더 나아지고 있습니다 : Vibe 코딩에 대한 생각Apr 19, 2025 am 11:17 AM

컨퍼런스와 전시회에서 무슨 일이 일어나고 있는지 볼 수 있습니다. 엔지니어에게 자신이하고있는 일을 물어 보거나 CEO와 상담 할 수 있습니다. 당신이 보는 곳마다, 상황은 졸린 속도로 변화하고 있습니다. 엔지니어 및 비 엔지니어 차이점은 무엇입니까?

Rocketpy -Analytics Vidhya를 사용한 로켓 런칭 시뮬레이션 및 분석Apr 19, 2025 am 11:12 AM

Rocketpy : 포괄적 인 가이드로 로켓 발사 시뮬레이션 이 기사는 강력한 파이썬 라이브러리 인 Rocketpy를 사용하여 고출력 로켓 런칭을 시뮬레이션하는 것을 안내합니다. 로켓 구성 요소 정의에서 Simula 분석에 이르기까지 모든 것을 다룰 것입니다.

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

Dreamweaver Mac版

시각적 웹 개발 도구

Atom Editor Mac 버전 다운로드

가장 인기 있는 오픈 소스 편집기

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.