Sky-T1 : GPT-4O 및 Deepseek V3에 도전하는 $ 450 llm-일체 포함-php.cn

집

기술 주변기기

일체 포함

Sky-T1 : GPT-4O 및 Deepseek V3에 도전하는 $ 450 llm

Jennifer Aniston

Mar 10, 2025 am 10:20 AM

UC Berkeley의 Novasky 팀은 AI 세계에서 획기적인 업적을 달성하여 Sky-T1-32B-Prreview를 공개했습니다. 이 모델은 GPT-4 및 O1과 같은 주요 상업용 모델의 성능을 경쟁하지만 교육 비용은 450 달러 미만이었습니다. 이것은 일반적으로 그러한 고급 AI 개발과 관련된 수백만 달러 예산을 극적으로 약화시킵니다. Sky-T1-32B-Prreview의 접근성이 가장 중요한 측면입니다. 전체 프로젝트 (데이터, 코드 및 모델 가중치)는 공개적으로 이용 가능하며, 연구원, 학자 및 애호가가 AI의 개선과 더 많은 민주화에 기여할 수 있도록 힘을 실어줍니다.

Sky-T1-32B-PREVIEW를 구별하는 것은 무엇입니까?

내부 작업이 독점적 인 상태로 유지되는 많은 고성능 모델과 달리 Sky-T1-32B- 프리뷰는 완전한 투명성을 제공합니다. 수학적 추론과 코딩 작업 모두에서 탁월한 성능은 특히 주목할 만하다.

Sky-T1-32B-PRREVIEW의 생성 :

개발 과정에는 몇 가지 주요 단계가 포함되었습니다

엄격한 데이터 큐 레이션 :

수학, 코딩, 과학 및 퍼즐을 포함하는 다양한 데이터 세트가 데이터 품질을 보장하기 위해 거부 샘플링과 같은 기술을 사용하여 세 심하게 수집하고 개선되었습니다. 데이터 재구성이 더욱 향상된 정확도

효율적인 교육 : 팀은 준비된 데이터 세트를 사용하여 오픈 소스 QWEN-2.5-32B 모델을 미세 조정했습니다. 8 개의 고급 GPU에서 단 19 시간 만에 완료된 교육 과정은 접근 방식의 효율성을 강조합니다.

Sky-T1: The 0 LLM Challenging GPT-4o & DeepSeek V3 균형 훈련 데이터 :

주요 성공 요인은 교육 데이터에서 수학과 코딩 문제 사이의 신중한 균형을 유지하여 모델이 두 영역 모두에서 탁월 할 수있게하는 것이 었습니다.

벤치 마크 결과 :

수학 : AMAME에서 82.4% 정확도를 달성했으며 AIME2024에서 43.3%, 최고 상업용 모델과의 경쟁.
코딩 :
주요 결과 :
데이터 다양성은 핵심입니다.
최적의 모델 크기 :
실험에서 32b 매개 변수 모델이 고급 추론 기능을 달성하기위한 최적의 크기임을 보여주었습니다. 오픈 소스 추론의 미래 :
Sky-T1-32B-PrReview는 중요한 단계를 나타내며 Novasky는 모델 효율성과 정확도를 계속 정제 할 계획입니다. 오픈 소스 개발에 대한 그들의 헌신은 협업을 촉진하고 분야의 진보를 가속화합니다. 자원 :

[코드 링크] [기술 보고서] <s s> [모델 가중치] </s><p> <strong> 결론 : </strong> Novasky의 업적은 비싸고 폐쇄 소스 AI 개발의 확립 된 패러다임에 도전합니다. 고성능 모델이 저렴하고 공개적으로 만들어 질 수 있음을 입증함으로써 최첨단 AI 기술에 대한 접근을 민주화하고보다 포괄적이고 협력적인 연구 환경을 조성하고 있습니다.</p>

위 내용은 Sky-T1 : GPT-4O 및 Deepseek V3에 도전하는 $ 450 llm의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

메타의 새로운 AI 어시스턴트 : 생산성 부스터 또는 시간 싱크?May 01, 2025 am 11:18 AM

Meta는 NVIDIA, IBM 및 DELL과 같은 파트너와 함께 LLAMA 스택의 엔터프라이즈 수준 배포 통합을 확장했습니다. 보안 측면에서 Meta는 Llama Guard 4, Llamafirewall 및 Cyberseceval 4와 같은 새로운 도구를 출시했으며 AI 보안을 향상시키기 위해 LLAMA Defenders 프로그램을 시작했습니다. 또한 Meta는 공공 서비스, 건강 관리 및 교육을 개선하기 위해 노력하는 신생 기업을 포함하여 10 개의 글로벌 기관에 LLAMA Impact Grants의 150 만 달러를 배포했습니다. Llama 4에 의해 구동되는 새로운 Meta AI 응용 프로그램, Meta AI로 생각됩니다.

Gen Zers의 80%가 AI : 연구와 결혼 할 것입니다May 01, 2025 am 11:17 AM

인간 -AI 상호 작용을 개척하는 회사 인 Joi AI는 이러한 진화하는 관계를 설명하기 위해 "AI-Lationships"라는 용어를 도입했습니다. Joi AI의 관계 치료사 인 Jaime Bronstein은 이것이 인간 C를 대체하는 것이 아니라는 것을 분명히합니다.

AI는 인터넷의 봇 문제를 악화시키고 있습니다. 이 20 억 달러 규모의 스타트 업은 최전선에 있습니다May 01, 2025 am 11:16 AM

온라인 사기와 봇 공격은 비즈니스에 큰 도전을 제기합니다. 소매 업체는 봇과 싸우고, 은행은 전투 계정 인수 및 소셜 미디어 플랫폼이 사천자와 어려움을 겪고 있습니다. AI의 부상은이 문제를 악화시킨다

로봇에 판매 : 비즈니스를 만들거나 파괴 할 마케팅 혁명May 01, 2025 am 11:15 AM

AI 에이전트는 마케팅에 혁명을 일으킬 준비가되어 있으며 이전 기술 변화의 영향을 능가 할 수 있습니다. 생성 AI의 상당한 발전을 나타내는이 에이전트는 Chatgpt와 같은 정보뿐만 아니라 Actio도 취합니다.

컴퓨터 비전 기술이 NBA 플레이 오프를 혁신하는 방법May 01, 2025 am 11:14 AM

중요한 NBA 게임 4 결정에 대한 AI의 영향 두 가지 중추적 인 게임 4 NBA 매치업은 AI의 게임 변화 역할을 선보였습니다. 첫 번째로 덴버의 Nikola Jokic의 놓친 3 점은 Aaron Gordon의 마지막으로 골목길을 이끌었습니다. 소니의 매

AI가 재생 의학의 미래를 가속화하는 방법May 01, 2025 am 11:13 AM

전통적으로 전 세계적으로 재생 의학 전문 지식을 확장하여 광범위한 여행, 실습 교육 및 수년간의 멘토링을 요구했습니다. 이제 AI는이 환경을 변화시키고 지리적 한계를 극복하고 EN을 통한 진행 상황을 가속화하고 있습니다.

Intel Foundry Direct Connect 2025의 주요 테이크 아웃May 01, 2025 am 11:12 AM

인텔은 제조 공정을 선도적 인 위치로 반환하기 위해 노력하고 있으며 팹 반도체 고객을 유치하여 팹에서 칩을 만들려고 노력하고 있습니다. 이를 위해 인텔은 프로세스의 경쟁력을 증명할뿐만 아니라 파트너가 친숙하고 성숙한 워크 플로우, 일관되고 신뢰할 수있는 방식으로 칩을 제조 할 수 있음을 보여주기 위해 업계에 대한 신뢰를 더 많이 구축해야합니다. 오늘 내가 듣는 모든 것은 인텔 이이 목표를 향해 나아가고 있다고 믿게 만듭니다. 새로운 CEO 인 탄 리바이 (Tan Libai)의 기조 연설이 그 날을 시작했다. Tan Libai는 간단하고 간결합니다. 그는 Intel의 Foundry Services에서 몇 가지 과제를 간략하게 설명하고 회사가 이러한 과제를 해결하고 향후 인텔의 파운드리 서비스를위한 성공적인 경로를 계획하기 위해 취한 조치를 취했습니다. Tan Libai는 고객을 더 많이 만들기 위해 인텔의 OEM 서비스가 구현되는 과정에 대해 이야기했습니다.

ai 잘못 되었나요? 이제 보험이 있습니다May 01, 2025 am 11:11 AM

AI 위험과 관련된 점점 더 많은 문제를 해결하기 위해, 글로벌 특수 재보험 회사 인 Chaucer Group 및 Armilla AI는 TPL (Third-Party Liability) 보험 상품을 도입하기 위해 힘을 합쳤습니다. 이 정책은 비즈니스를 보호합니다

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

SecList

SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.