Sky-T1: $ 450 LLM Mencabar GPT-4O & DeepSeek v3-AI-php.cn

Rumah

Peranti teknologi

Sky-T1: $ 450 LLM Mencabar GPT-4O & DeepSeek v3

Jennifer Aniston

Mar 10, 2025 am 10:20 AM

Pasukan Novasky UC Berkeley telah mencapai prestasi terobosan di dunia AI, melancarkan Sky-T1-32B-Preview-model penalaran sumber yang sangat berpatutan dan penuh. Model ini menyaingi prestasi model komersil terkemuka seperti GPT-4 dan O1, namun kos latihannya berada di bawah $ 450. Ini secara dramatik mengurangkan belanjawan berjuta-juta dolar yang biasanya dikaitkan dengan pembangunan AI yang maju.

Kebolehcapaian Sky-T1-32B-Preview adalah aspek yang paling penting. Seluruh projek -data, kod, dan berat model -tersedia secara terbuka, memberi kuasa kepada penyelidik, ahli akademik, dan peminat untuk menyumbang kepada peningkatannya dan seterusnya pendemokrasian AI.

Apa yang menetapkan Sky-T1-32B-Preview selain?

Tidak seperti banyak model berprestasi tinggi yang kerja dalamannya tetap proprietari, Sky-T1-32B-Preview menawarkan ketelusan lengkap. Prestasi yang luar biasa dalam kedua -dua penalaran matematik dan tugas pengekodan sangat penting.

Penciptaan Sky-T1-32B-Preview:

~~Proses pembangunan melibatkan beberapa langkah utama:~~

Curation data yang ketat:
pelbagai dataset yang merangkumi matematik, pengekodan, sains, dan teka -teki dengan teliti dikumpulkan dan ditapis menggunakan teknik seperti pensampelan penolakan untuk memastikan kualiti data. Data memformat semula ketepatan yang dipertingkatkan lagi.
Latihan yang cekap:
Pasukan ini menyempurnakan model QWEN-2.5-32B sumber terbuka menggunakan dataset yang disediakan. Proses latihan, yang disiapkan hanya dalam 19 jam pada lapan GPU mewah, menyoroti kecekapan pendekatan mereka.
Data Latihan Balanced:
Faktor kejayaan utama adalah keseimbangan yang teliti antara masalah matematik dan pengekodan dalam data latihan, membolehkan model untuk unggul di kedua -dua kawasan.

Hasil penanda aras:

prestasi Sky-T1-32B-Preview adalah luar biasa di pelbagai tanda aras:

mencapai ketepatan 82.4% pada Math500 dan 43.3% pada AIME2024, kompetitif dengan model komersil teratas. pengekodan:

Penemuan Utama: Sky-T1: The 0 LLM Challenging GPT-4o & DeepSeek V3

Kepelbagaian data adalah kunci:

Campuran data matematik dan pengekodan seimbang sangat penting untuk kejayaan model.

Saiz model optimum: Eksperimen menunjukkan bahawa model parameter 32B adalah saiz optimum untuk mencapai keupayaan penalaran maju.
Masa Depan Penalaran Sumber Terbuka:

Sky-T1-32B-Preview mewakili langkah penting ke hadapan, dan Novasky merancang untuk meneruskan kecekapan dan ketepatan model penapisan. Komitmen mereka untuk pembangunan sumber terbuka memupuk kerjasama dan mempercepatkan kemajuan dalam bidang.

Sumber:

[pautan ke kod]
[Laporan Teknikal]
[berat model]

Kesimpulan:

Pencapaian Novasky mencabar paradigma yang ditubuhkan dari pembangunan AI yang mahal dan tertutup. Dengan menunjukkan bahawa model berprestasi tinggi boleh diwujudkan dengan mudah dan terbuka, mereka mendemokrasikan akses kepada teknologi AI canggih dan memupuk persekitaran penyelidikan yang lebih inklusif dan kolaboratif.

Atas ialah kandungan terperinci Sky-T1: $ 450 LLM Mencabar GPT-4O & DeepSeek v3. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel Berkaitan

Ahli terapi AI ada di sini: 14 alat kesihatan mental yang perlu anda ketahuiApr 30, 2025 am 11:17 AM

Walaupun ia tidak dapat memberikan sambungan manusia dan intuisi ahli terapi terlatih, penyelidikan telah menunjukkan bahawa ramai orang selesa berkongsi kebimbangan dan kebimbangan mereka dengan bot AI yang agak tidak berwajah dan tanpa nama. Sama ada ini selalu baik saya

Memanggil AI ke lorong runcitApr 30, 2025 am 11:16 AM

Kecerdasan Buatan (AI), satu dekad teknologi dalam pembuatan, merevolusikan industri runcit makanan. Dari keuntungan kecekapan berskala besar dan pengurangan kos kepada proses yang diselaraskan di pelbagai fungsi perniagaan, kesan AI adalah undeniabl

Mendapatkan ceramah pep dari ai generatif untuk mengangkat semangat andaApr 30, 2025 am 11:15 AM

Mari kita bercakap mengenainya. Analisis terobosan AI yang inovatif ini adalah sebahagian daripada liputan lajur Forbes yang berterusan pada AI terkini termasuk mengenal pasti dan menjelaskan pelbagai kerumitan AI yang memberi kesan (lihat pautan di sini). Di samping itu, untuk comp saya

Mengapa Hyper-Personalization berkuasa AI adalah satu kemestian untuk semua perniagaanApr 30, 2025 am 11:14 AM

Mengekalkan imej profesional memerlukan kemas kini almari pakaian sekali -sekala. Walaupun membeli-belah dalam talian adalah mudah, ia tidak mempunyai kepastian percubaan secara peribadi. Penyelesaian saya? Peribadi yang berkuasa AI. Saya membayangkan pembantu AI yang mengendalikan pakaian selecti

Lupakan Duolingo: Ciri AI Baru Google Translate Mengajar BahasaApr 30, 2025 am 11:13 AM

Google Translate menambah fungsi pembelajaran bahasa Menurut Android Authority, App Expers AssembleDebug telah mendapati bahawa versi terbaru aplikasi Google Translate mengandungi mod ujian "amalan" baru yang direka untuk membantu pengguna meningkatkan kemahiran bahasa mereka melalui aktiviti yang diperibadikan. Ciri ini kini tidak dapat dilihat oleh pengguna, tetapi AssembleDebug dapat mengaktifkannya dan melihat beberapa elemen antara muka pengguna yang baru. Apabila diaktifkan, ciri ini menambah ikon topi tamat pengajian baru di bahagian bawah skrin yang ditandai dengan lencana "beta" yang menunjukkan bahawa ciri "amalan" akan dikeluarkan pada mulanya dalam bentuk eksperimen. Prompt pop timbul yang berkaitan menunjukkan "Amalan aktiviti yang disesuaikan untuk anda!", Yang bermaksud Google akan menjana disesuaikan

Mereka membuat TCP/IP untuk AI, dan ia dipanggil NandaApr 30, 2025 am 11:12 AM

Penyelidik MIT sedang membangunkan Nanda, protokol web yang direka untuk agen AI. Pendek untuk ejen rangkaian dan AI yang terdesentralisasi, Nanda membina Protokol Konteks Model Anthropic (MCP) dengan menambahkan keupayaan Internet, membolehkan AI AGEN

The Prompt: Deepfake Detection adalah perniagaan yang berkembang pesatApr 30, 2025 am 11:11 AM

Usaha terbaru Meta: Aplikasi AI untuk menyaingi chatgpt Meta, syarikat induk Facebook, Instagram, WhatsApp, dan Threads, melancarkan aplikasi berkuasa AI yang baru. Aplikasi mandiri ini, Meta AI, bertujuan untuk bersaing secara langsung dengan chatgpt Openai. Tuil

Dua tahun akan datang dalam keselamatan siber AI untuk pemimpin perniagaanApr 30, 2025 am 11:10 AM

Menavigasi serangan AI Cyber yang semakin meningkat Baru-baru ini, Jason Clinton, Ciso untuk Anthropic, menggariskan risiko yang muncul yang terikat kepada identiti bukan manusia-sebagai komunikasi komunikasi ke mesin, melindungi "identiti" ini menjadi

See all articles

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Tunjukkan Lagi

Artikel Panas

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

3 minggu yang laluByDDD

Bagaimana untuk memperbaiki KB5055523 gagal dipasang di Windows 11?

2 minggu yang laluByDDD

Inzoi: Cara Memohon ke Sekolah dan Universiti

4 minggu yang laluByDDD

Bagaimana untuk memperbaiki KB5055518 gagal dipasang di Windows 10?

2 minggu yang laluByDDD

Roblox: Rails Dead - Cara Memanggil dan Mengalahkan Nikola Tesla

1 bulan yang laluBy尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat ialah persekitaran pelayar selamat untuk mengambil peperiksaan dalam talian dengan selamat. Perisian ini menukar mana-mana komputer menjadi stesen kerja yang selamat. Ia mengawal akses kepada mana-mana utiliti dan menghalang pelajar daripada menggunakan sumber yang tidak dibenarkan.