ホームページ >テクノロジー周辺機器 >AI >DeepGemmはDeepseekオープンソースウィークの3日目にリリースされました
deepseekリリースdeepgemm:ai
の高性能FP8GEMMライブラリ目次deepgemmの導入 - 密集したgemmsとmoe gemmsをサポートするFP8 GEMMライブラリ、V3/R1のトレーニングと推論を強化します。
hopper gpus上の最大1350 fp8 tflops
oly使いやすいように設計された最小限の依存関係compilent完全にコンパイルされています…
- deepseek(@deepseek_ai)2025年2月26日このリリースは、Deepseek FlashML(1日目)とDeepseek Deepep(2日目)の発売の成功に続きます。
gemmとは?
fp8?一般的なマトリックス乗算(GEMM)は、2つのマトリックスを増やして3分の1を生成する基本的な線形代数操作です。 多数のアプリケーションで広く使用されており、その式は次のとおりです
GEMMは、特にニューラルネットワークトレーニングと推論のための深い学習において、モデルのパフォーマンスの最適化に重要です。
とは何ですか
典型的なFP8形式には次のものが含まれます
1サインビット 5指数ビット
2分数ビット
このコンパクトな構造により、大規模なモデルのトレーニングに最適な、より速い計算とメモリの使用量が減少する可能性があります。 精度はわずかに損なわれる可能性がありますが、これはしばしば受け入れられ、計算オーバーヘッドの減少によりパフォーマンスの向上につながります。
の必要性 DeepGEMMは、多様なGEMM操作のために軽量で高性能でユーザーフレンドリーなライブラリを提供することにより、マトリックスの乗算の課題に対処します。
AIコミュニティで最適化されたFP8 GEMMの重要な必要性を満たします。 小さなメモリフットプリントを備えた高性能
ハイパフォーマンス:nvidiaホッパーgpusで最大1350 fp8 tflopsを達成します。
軽量設計:カスタムスタイル
/ .custom-table { 幅:100%; 国境崩壊:崩壊; /
境界線が2倍にならないようにします/ マージン:20px 0; } .custom-tableth、.custom-table td { 国境:1pxソリッド#000; /可視境界 パディング:12px; /快適なパディング/ テキストアライグ:センター; /中央のテキスト
表1:deepgemmパフォーマンスベンチマーク
インストール手順
deepgemmのインストールは簡単です:
ステップ1:前提条件
ステップ2:リポジトリをクローン
git clone --recursive [email protected]:deepseek-ai/DeepGEMM.git
ステップ3:ライブラリをインストールします
python setup.py install
ステップ4:deepgemmをインポート
import deep_gemm
詳細な手順については、DeepGEMM GitHubリポジトリを参照してください
結論
DeepGEMMは、高度な機械学習タスクに最適な高性能で使いやすいFP8 GEMMライブラリです。 その軽量設計、速度、柔軟性により、AI開発者にとって貴重なツールになります。 Deepseekの4日目のリリースに関する最新情報については、Analytics Vidhyaブログを確認してください!以上がDeepGemmはDeepseekオープンソースウィークの3日目にリリースされましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。