搜尋
首頁科技週邊人工智慧Sky-T1:$ 450 LLM挑戰GPT-4O&DeepSeek V3

UC Berkeley的Novasky團隊在AI世界中取得了突破性的壯舉,揭開了Sky-T1-32B-Preview,這是一種價格合理且完全開源的推理模型。 該模型可與GPT-4和O1等領先的商業模型的性能相媲美,但其培訓成本低於450美元。 這大大削弱了通常與這樣高級AI開發相關的數百萬美元的預算。

Sky-T1-32b-preiview的可訪問性是其最重要的方面。 整個項目(數據,代碼和模型權重)是公開可用的,賦予研究人員,學者和愛好者的能力

是什麼設置了SKY-T1-32B-PREVIEW?

>與許多內部運作的高性能模型不同,SKY-T1-32B-PREVIEW提供了完全透明度。 它在數學推理和編碼任務中的出色表現尤其值得注意。 >

創建Sky-t1-32b-preview:

>

開發過程涉及多個關鍵步驟:

Sky-T1: The 0 LLM Challenging GPT-4o & DeepSeek V3

嚴格的數據策劃:使用拒絕採樣等技術對數學,編碼,科學和拼圖的各種數據集進行了精心收集和精製,以確保數據質量。 數據重新格式化進一步提高了準確性。

  1. 有效的培訓:團隊使用其準備好的數據集對開源QWEN-2.5-32B模型進行了微調。 培訓過程僅在八個高端GPU上完成19個小時內完成,突出了其方法的效率。

  2. >
  3. 平衡培訓數據:

    一個關鍵的成功因素是培訓數據中的數學和編碼問題之間的仔細平衡,使模型能夠在這兩個領域中表現出色。

  4. 基準測試結果:
  5. 在各種基準中,Sky-t1-32b-preview的性能是出色的:

    >數學:
  6. 在數學500上的精度為82.4%,AIME2024的精度為43.3%,與頂級商業模型競爭。

編碼:在livecodebench-easy上得分為86.3%,證明了精通複雜的編碼任務。

  • 鍵調查結果:
  • 數據多樣性是關鍵:數學和編碼數據的平衡組合對於模型的成功至關重要。 最佳模型尺寸:
  • 實驗表明,32B參數模型是實現高級推理能力的最佳大小。

Sky-T1: The 0 LLM Challenging GPT-4o & DeepSeek V3開源推理的未來:

>

> SKY-T1-32B-PREVIEW代表著重要的一步,Novasky計劃繼續提高模型效率和準確性。 他們致力於開源開發促進了合作,並加速了該領域的進步。

資源:

    [鏈接到代碼]
  • [技術報告]
  • [模型權重]

結論: Novasky的成就挑戰了昂貴的封閉源AI開發的既定範式。 通過證明可以負擔得起,公開地創建高性能模型,它們正在民主化訪問尖端AI技術並培養更具包容性和協作的研究環境。

以上是Sky-T1:$ 450 LLM挑戰GPT-4O&DeepSeek V3的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
META的新AI助手:生產力助推器還是時間下沉?META的新AI助手:生產力助推器還是時間下沉?May 01, 2025 am 11:18 AM

Meta攜手Nvidia、IBM和Dell等合作夥伴,拓展了Llama Stack的企業級部署整合。在安全方面,Meta推出了Llama Guard 4、LlamaFirewall和CyberSecEval 4等新工具,並啟動了Llama Defenders計劃,以增強AI安全性。此外,Meta還向10個全球機構(包括致力於改善公共服務、醫療保健和教育的初創企業)發放了總額150萬美元的Llama Impact Grants。 由Llama 4驅動的全新Meta AI應用,被設想為Meta AI

80%的Zers將嫁給AI:研究80%的Zers將嫁給AI:研究May 01, 2025 am 11:17 AM

公司開創性的人類互動公司Joi AI介紹了“ AI-Iatsionship”一詞來描述這些不斷發展的關係。 Joi AI的關係治療師Jaime Bronstein澄清說,這並不是要取代人類C

AI使互聯網的機器人問題變得更糟。這家耗資20億美元的創業公司在前線AI使互聯網的機器人問題變得更糟。這家耗資20億美元的創業公司在前線May 01, 2025 am 11:16 AM

在線欺詐和機器人攻擊對企業構成了重大挑戰。 零售商與機器人ho積產品,銀行戰斗帳戶接管以及社交媒體平台與模仿者鬥爭。 AI的興起加劇了這個問題,Rende

賣給機器人:將創造或破壞業務的營銷革命賣給機器人:將創造或破壞業務的營銷革命May 01, 2025 am 11:15 AM

AI代理人有望徹底改變營銷,並可能超過以前技術轉變的影響。 這些代理代表了生成AI的重大進步,不僅是處理諸如chatgpt之類的處理信息,而且還採取了Actio

計算機視覺技術如何改變NBA季后賽主持人計算機視覺技術如何改變NBA季后賽主持人May 01, 2025 am 11:14 AM

人工智能對關鍵NBA遊戲4決策的影響 兩場關鍵遊戲4 NBA對決展示了AI在主持儀式中改變遊戲規則的角色。 首先,丹佛的尼古拉·喬基奇(Nikola Jokic)錯過了三分球,導致亞倫·戈登(Aaron Gordon)的最後一秒鐘。 索尼的鷹

AI如何加速再生醫學的未來AI如何加速再生醫學的未來May 01, 2025 am 11:13 AM

傳統上,擴大重生醫學專業知識在全球範圍內要求廣泛的旅行,動手培訓和多年指導。 現在,AI正在改變這一景觀,克服地理局限性並通過EN加速進步

Intel Foundry Direct Connect 2025的關鍵要點Intel Foundry Direct Connect 2025的關鍵要點May 01, 2025 am 11:12 AM

英特爾正努力使其製造工藝重回領先地位,同時努力吸引無晶圓廠半導體客戶在其晶圓廠製造芯片。為此,英特爾必須在業界建立更多信任,不僅要證明其工藝的競爭力,還要證明合作夥伴能夠以熟悉且成熟的工作流程、一致且高可靠性地製造芯片。今天我聽到的一切都讓我相信英特爾正在朝著這個目標前進。 新任首席執行官譚立柏的主題演講拉開了當天的序幕。譚立柏直率而簡潔。他概述了英特爾代工服務的若干挑戰,以及公司為應對這些挑戰、為英特爾代工服務的未來規劃成功路線而採取的措施。譚立柏談到了英特爾代工服務正在實施的流程,以更以客

AI出了問題嗎?現在在那里為此保險AI出了問題嗎?現在在那里為此保險May 01, 2025 am 11:11 AM

全球專業再保險公司Chaucer Group和Armilla AI解決了圍繞AI風險的日益嚴重的問題,已聯手引入了新型的第三方責任(TPL)保險產品。 該政策保護業務不利

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器