찾다
기술 주변기기일체 포함Sky-T1 : GPT-4O 및 Deepseek V3에 도전하는 $ 450 llm

UC Berkeley의 Novasky 팀은 AI 세계에서 획기적인 업적을 달성하여 Sky-T1-32B-Prreview를 공개했습니다. 이 모델은 GPT-4 및 O1과 같은 주요 상업용 모델의 성능을 경쟁하지만 교육 비용은 450 달러 미만이었습니다. 이것은 일반적으로 그러한 고급 AI 개발과 관련된 수백만 달러 예산을 극적으로 약화시킵니다. Sky-T1-32B-Prreview의 접근성이 가장 중요한 측면입니다. 전체 프로젝트 (데이터, 코드 및 모델 가중치)는 공개적으로 이용 가능하며, 연구원, 학자 및 애호가가 AI의 개선과 더 많은 민주화에 기여할 수 있도록 힘을 실어줍니다.

Sky-T1-32B-PREVIEW를 구별하는 것은 무엇입니까?

내부 작업이 독점적 인 상태로 유지되는 많은 고성능 모델과 달리 Sky-T1-32B- 프리뷰는 완전한 투명성을 제공합니다. 수학적 추론과 코딩 작업 모두에서 탁월한 성능은 특히 주목할 만하다.

Sky-T1-32B-PRREVIEW의 생성 :

개발 과정에는 몇 가지 주요 단계가 포함되었습니다

엄격한 데이터 큐 레이션 :

수학, 코딩, 과학 및 퍼즐을 포함하는 다양한 데이터 세트가 데이터 품질을 보장하기 위해 거부 샘플링과 같은 기술을 사용하여 세 심하게 수집하고 개선되었습니다. 데이터 재구성이 더욱 향상된 정확도

효율적인 교육 : 팀은 준비된 데이터 세트를 사용하여 오픈 소스 QWEN-2.5-32B 모델을 미세 조정했습니다. 8 개의 고급 GPU에서 단 19 시간 만에 완료된 교육 과정은 접근 방식의 효율성을 강조합니다.

Sky-T1: The 0 LLM Challenging GPT-4o & DeepSeek V3 균형 훈련 데이터 :

주요 성공 요인은 교육 데이터에서 수학과 코딩 문제 사이의 신중한 균형을 유지하여 모델이 두 영역 모두에서 탁월 할 수있게하는 것이 었습니다.

벤치 마크 결과 :
    Sky-T1-32B-Prreview의 성능은 다양한 벤치 마크에서 예외적입니다
  1. 수학 : AMAME에서 82.4% 정확도를 달성했으며 AIME2024에서 43.3%, 최고 상업용 모델과의 경쟁.

    코딩 :
  2. 는 LiveCodebench-Easy에서 86.3%를 기록하여 복잡한 코딩 작업의 숙련도를 보여줍니다.
  3. 주요 결과 :

    데이터 다양성은 핵심입니다.
  4. 수학 및 코딩 데이터의 균형 잡힌 혼합은 모델의 성공에 중요했습니다.
  5. 최적의 모델 크기 :

    실험에서 32b 매개 변수 모델이 고급 추론 기능을 달성하기위한 최적의 크기임을 보여주었습니다. 오픈 소스 추론의 미래 :

    Sky-T1-32B-PrReview는 중요한 단계를 나타내며 Novasky는 모델 효율성과 정확도를 계속 정제 할 계획입니다. 오픈 소스 개발에 대한 그들의 헌신은 협업을 촉진하고 분야의 진보를 가속화합니다. 자원 :

    [코드 링크] [기술 보고서] <s s> [모델 가중치] </s><p> <strong> 결론 : </strong> Novasky의 업적은 비싸고 폐쇄 소스 AI 개발의 확립 된 패러다임에 도전합니다. 고성능 모델이 저렴하고 공개적으로 만들어 질 수 있음을 입증함으로써 최첨단 AI 기술에 대한 접근을 민주화하고보다 포괄적이고 협력적인 연구 환경을 조성하고 있습니다.</p>

위 내용은 Sky-T1 : GPT-4O 및 Deepseek V3에 도전하는 $ 450 llm의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
메타의 새로운 AI 어시스턴트 : 생산성 부스터 또는 시간 싱크?메타의 새로운 AI 어시스턴트 : 생산성 부스터 또는 시간 싱크?May 01, 2025 am 11:18 AM

Meta는 NVIDIA, IBM 및 DELL과 같은 파트너와 함께 LLAMA 스택의 엔터프라이즈 수준 배포 통합을 확장했습니다. 보안 측면에서 Meta는 Llama Guard 4, Llamafirewall 및 Cyberseceval 4와 같은 새로운 도구를 출시했으며 AI 보안을 향상시키기 위해 LLAMA Defenders 프로그램을 시작했습니다. 또한 Meta는 공공 서비스, 건강 관리 및 교육을 개선하기 위해 노력하는 신생 기업을 포함하여 10 개의 글로벌 기관에 LLAMA Impact Grants의 150 만 달러를 배포했습니다. Llama 4에 의해 구동되는 새로운 Meta AI 응용 프로그램, Meta AI로 생각됩니다.

Gen Zers의 80%가 AI : 연구와 결혼 할 것입니다Gen Zers의 80%가 AI : 연구와 결혼 할 것입니다May 01, 2025 am 11:17 AM

인간 -AI 상호 작용을 개척하는 회사 인 Joi AI는 이러한 진화하는 관계를 설명하기 위해 "AI-Lationships"라는 용어를 도입했습니다. Joi AI의 관계 치료사 인 Jaime Bronstein은 이것이 인간 C를 대체하는 것이 아니라는 것을 분명히합니다.

AI는 인터넷의 봇 문제를 악화시키고 있습니다. 이 20 억 달러 규모의 스타트 업은 최전선에 있습니다AI는 인터넷의 봇 문제를 악화시키고 있습니다. 이 20 억 달러 규모의 스타트 업은 최전선에 있습니다May 01, 2025 am 11:16 AM

온라인 사기와 봇 공격은 비즈니스에 큰 도전을 제기합니다. 소매 업체는 봇과 싸우고, 은행은 전투 계정 인수 및 소셜 미디어 플랫폼이 사천자와 어려움을 겪고 있습니다. AI의 부상은이 문제를 악화시킨다

로봇에 판매 : 비즈니스를 만들거나 파괴 할 마케팅 혁명로봇에 판매 : 비즈니스를 만들거나 파괴 할 마케팅 혁명May 01, 2025 am 11:15 AM

AI 에이전트는 마케팅에 혁명을 일으킬 준비가되어 있으며 이전 기술 변화의 영향을 능가 할 수 있습니다. 생성 AI의 상당한 발전을 나타내는이 에이전트는 Chatgpt와 같은 정보뿐만 아니라 Actio도 취합니다.

컴퓨터 비전 기술이 NBA 플레이 오프를 혁신하는 방법컴퓨터 비전 기술이 NBA 플레이 오프를 혁신하는 방법May 01, 2025 am 11:14 AM

중요한 NBA 게임 4 결정에 대한 AI의 영향 두 가지 중추적 인 게임 4 NBA 매치업은 AI의 게임 변화 역할을 선보였습니다. 첫 번째로 덴버의 Nikola Jokic의 놓친 3 점은 Aaron Gordon의 마지막으로 골목길을 이끌었습니다. 소니의 매

AI가 재생 의학의 미래를 가속화하는 방법AI가 재생 의학의 미래를 가속화하는 방법May 01, 2025 am 11:13 AM

전통적으로 전 세계적으로 재생 의학 전문 지식을 확장하여 광범위한 여행, 실습 교육 및 수년간의 멘토링을 요구했습니다. 이제 AI는이 환경을 변화시키고 지리적 한계를 극복하고 EN을 통한 진행 상황을 가속화하고 있습니다.

Intel Foundry Direct Connect 2025의 주요 테이크 아웃Intel Foundry Direct Connect 2025의 주요 테이크 아웃May 01, 2025 am 11:12 AM

인텔은 제조 공정을 선도적 인 위치로 반환하기 위해 노력하고 있으며 팹 반도체 고객을 유치하여 팹에서 칩을 만들려고 노력하고 있습니다. 이를 위해 인텔은 프로세스의 경쟁력을 증명할뿐만 아니라 파트너가 친숙하고 성숙한 워크 플로우, 일관되고 신뢰할 수있는 방식으로 칩을 제조 할 수 있음을 보여주기 위해 업계에 대한 신뢰를 더 많이 구축해야합니다. 오늘 내가 듣는 모든 것은 인텔 이이 목표를 향해 나아가고 있다고 믿게 만듭니다. 새로운 CEO 인 탄 리바이 (Tan Libai)의 기조 연설이 그 날을 시작했다. Tan Libai는 간단하고 간결합니다. 그는 Intel의 Foundry Services에서 몇 가지 과제를 간략하게 설명하고 회사가 이러한 과제를 해결하고 향후 인텔의 파운드리 서비스를위한 성공적인 경로를 계획하기 위해 취한 조치를 취했습니다. Tan Libai는 고객을 더 많이 만들기 위해 인텔의 OEM 서비스가 구현되는 과정에 대해 이야기했습니다.

ai 잘못 되었나요? 이제 보험이 있습니다ai 잘못 되었나요? 이제 보험이 있습니다May 01, 2025 am 11:11 AM

AI 위험과 관련된 점점 더 많은 문제를 해결하기 위해, 글로벌 특수 재보험 회사 인 Chaucer Group 및 Armilla AI는 TPL (Third-Party Liability) 보험 상품을 도입하기 위해 힘을 합쳤습니다. 이 정책은 비즈니스를 보호합니다

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

SecList

SecList

SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.

Atom Editor Mac 버전 다운로드

Atom Editor Mac 버전 다운로드

가장 인기 있는 오픈 소스 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

ZendStudio 13.5.1 맥

ZendStudio 13.5.1 맥

강력한 PHP 통합 개발 환경