Sky-T1：GPT-4O＆Deepseek V3に挑戦する450ドルのLLM-AI-php.cn

ホームページ

テクノロジー周辺機器

Sky-T1：GPT-4O＆Deepseek V3に挑戦する450ドルのLLM

Jennifer Aniston

Mar 10, 2025 am 10:20 AM

UCバークレーのノヴァスキーチームは、AIの世界で画期的な偉業を達成し、Sky-T1-32B-Previewを発表しました。このモデルは、GPT-4やO1などの主要な商用モデルのパフォーマンスに匹敵しますが、トレーニングコストは450ドル未満でした。これは、このような高度なAI開発に通常関連する数百万ドルの予算を劇的に下げます。

Sky-T1-32B-Previewのアクセシビリティは、その最も重要な側面です。プロジェクト全体（DATA、コード、モデルの重み）は公開されており、研究者、学者、および愛好家がその改善に貢献し、AIの民主化に貢献している。

sky-t1-32b-previewを際立たせるものは何ですか？

内部の作業が独自のままである多くの高性能モデルとは異なり、Sky-T1-32B-Previewは完全な透明性を提供します。数学的推論とコーディングの両方のタスクの両方におけるその例外的なパフォーマンスは特に注目に値します。

SKY-T1-32B-PREVIEWの作成：

開発プロセスには、いくつかの重要なステップが含まれていました

Sky-T1: The 0 LLM Challenging GPT-4o & DeepSeek V3 厳密なデータキュレーション：

データの品質を確保するための拒絶サンプリングなどの手法を使用して、数学、コーディング、科学、パズルを含む多様なデータセットを細心の注意を払って収集および洗練しました。データの再フォーマットにより、精度がさらに向上しました

効率的なトレーニング：
チームは、準備されたデータセットを使用してオープンソースqwen-2.5-32bモデルを微調整しました。 8つのハイエンドGPUでわずか19時間で完了したトレーニングプロセスは、アプローチの効率を強調しています。
重要な成功要因は、トレーニングデータの数学とコーディングの問題の慎重なバランスであり、モデルが両方の領域で優れていることを可能にしました。

ベンチマークの結果：
SKY-T1-32B-PREVIEWのパフォーマンスは、さまざまなベンチマークで例外的です：

Math500で82.4％の精度、AIME2024で43.3％を達成し、トップの商業モデルと競争します。

コーディング：livecodebench-Eesyで86.3％を獲得し、複雑なコーディングタスクの習熟度を示しています。

重要な調査結果：
データの多様性が重要です：

最適なモデルサイズ： Sky-T1: The 0 LLM Challenging GPT-4o & DeepSeek V3 実験により、32Bパラメーターモデルが高度な推論機能を達成するための最適なサイズであることが示されました。

オープンソースの推論の未来：

Sky-T1-32B-Previewは大きな前進を表しており、Novaskyはモデルの効率と精度を洗練し続ける計画を立てています。オープンソース開発への彼らのコミットメントは、コラボレーションを促進し、フィールドの進歩を加速します。

リソース：

結論：

ノヴァスキーの功績は、高価で閉鎖ソースAI開発の確立されたパラダイムに挑戦しています。高性能モデルを手頃な価格で公然と作成できることを実証することにより、最先端のAIテクノロジーへのアクセスを民主化し、より包括的で共同研究環境を促進しています。

以上がSky-T1：GPT-4O＆Deepseek V3に挑戦する450ドルのLLMの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

AIセラピストがここにいます：あなたが知る必要がある14の画期的なメンタルヘルスツールApr 30, 2025 am 11:17 AM

訓練を受けたセラピストの人間のつながりと直観を提供することはできませんが、多くの人々は、比較的顔のない匿名のAIボットと心配や懸念を共有することを快適に共有していることが研究で示されています。これが常に良いかどうか

食料品の通路にAIを呼びますApr 30, 2025 am 11:16 AM

数十年の技術である人工知能（AI）は、食品小売業界に革命をもたらしています。大規模な効率性の向上とコスト削減から、さまざまなビジネス機能にわたる合理化されたプロセスまで、AIの影響はUndeniablです

あなたの精神を持ち上げるために生成的なAIからPEPの話をするApr 30, 2025 am 11:15 AM

それについて話しましょう。革新的なAIブレークスルーのこの分析は、さまざまなインパクトのあるAIの複雑さを特定して説明するなど、最新のAIで進行中のForbes列のカバレッジの一部です（こちらのリンクを参照）。さらに、私のコンプのために

AI駆動のハイパーパーソナリゼーションがすべてのビジネスにとって必須である理由Apr 30, 2025 am 11:14 AM

プロの画像を維持するには、時折ワードローブの更新が必要です。オンラインショッピングは便利ですが、対面の試練の確実性がありません。私の解決策？ AI駆動のパーソナライズ。衣類の選択をキュレーションするAIアシスタントが想像しています

Duolingoを忘れてください：Google Translateの新しいAI機能は言語を教えていますApr 30, 2025 am 11:13 AM

Google Translateは言語学習機能を追加します Android Authorityによると、App Expert AssemberBugは、Google Translateアプリの最新バージョンには、パーソナライズされたアクティビティを通じてユーザーが言語スキルを向上させるように設計された新しい「実践」モードのテストコードが含まれていることを発見しました。この機能は現在、ユーザーには見えませんが、AssembleDebugはそれを部分的にアクティブにして、新しいユーザーインターフェイス要素の一部を表示できます。アクティブ化すると、この機能は、「ベータ」バッジでマークされた画面の下部に新しい卒業キャップアイコンを追加し、「実践」機能が最初に実験形式でリリースされることを示します。関連するポップアッププロンプトは、「あなたのために調整されたアクティビティを練習してください！」を示しています。つまり、Googleがカスタマイズされたことを意味します

彼らはAIのためにTCP/IPを作成しており、Nandaと呼ばれていますApr 30, 2025 am 11:12 AM

MITの研究者は、AIエージェント向けに設計された画期的なWebプロトコルであるNandaを開発しています。ネットワークエージェントと分散型AIの略であるNandaは、インターネット機能を追加することにより、人類のモデルコンテキストプロトコル（MCP）に基づいて構築され、AI Agenを可能にします

プロンプト：Deepfake Detectionは活況を呈しているビジネスですApr 30, 2025 am 11:11 AM

メタの最新のベンチャー：chatgptに匹敵するAIアプリ Facebook、Instagram、WhatsApp、およびThreadsの親会社であるMetaは、新しいAIを搭載したアプリケーションを立ち上げています。このスタンドアロンアプリであるMeta AIは、OpenaiのChatGptと直接競争することを目指しています。レバー