Deepseekは、2025年2月28日にオープンソース機能を大幅に向上させ、Fire Flyer File System(3FS)と天然のデータ処理フレームワークを発表しました。 これらのツールは、特にAIトレーニングと推論のために、データアクセスと処理に革命をもたらすように設計されています。
? #opensourceweekの5日目:3FS、すべてのDeepSeekデータアクセスのための強力なエンジン。Fire-Flyer File System(3FS) - 最新のSSDとRDMAネットワークの帯域幅を最大化する並列ファイルシステム。
⚡6.6TIB/s集合体読み取りスループット(180ノードクラスター) ⚡3.66 TIB/min…- deepseek(@deepseek_ai)2025年2月28日
目次
Fire-Flyer File System(3FS)
- smallpondフレームワーク
- クイックスタート:3FSおよびSMALDPOND
- トラブルシューティングと監視
- 要約
- Fire-Flyer File System(3FS)
rdma
を理解していますリモートダイレクトメモリアクセス(RDMA)オペレーティングシステムの制限をバイパスし、2つのコンピューターのメモリ間で直接データ転送を可能にします。これにより、より速く、より効率的な通信が生じます
キー3FS機能
-
比類のないパフォーマンスと使いやすさ:
- 6.6 TIB/Sアグリゲート読み取りスループット(180ノードクラスター)。
- 3.66 GraySortベンチマーク(25ノードクラスター)のTIB/MINスループット 40 gib/s kvcache lookupsのクライアントノードあたりのピークスループット
- 分解されたアーキテクチャ:
- 数千のSSDのスループットと、数百のストレージノードのネットワーク帯域幅を組み合わせています。
- アプリケーション用の地域の巧妙なストレージアクセスを提供しています。
堅牢な一貫性: -
強い一貫性のために、配分されたクエリ(CRAQ)を使用してチェーンレプリケーションを使用し、アプリケーションコーディングを簡素化します。
-
トランザクションキー値ストア(例:FoundationDB)に基づいて、ステートレスメタデータサービスを使用しています。
おなじみのファイルインターフェイスを維持し、新しいAPI学習の必要性を排除します。
- サポートされているワークロード
データの準備:
- チェックポイント:大規模トレーニングのハイスループット並列チェックポイントをサポートしています。 推論のための
- kvcache:は、容量が大幅に増加したDRAMベースのキャッシュに代わる費用対効果の高いハイスループットの代替品を提供します。 パフォーマンスベンチマーク
- 広範なテストで3FSパフォーマンスを検証します。 大規模なクラスターでの読み取りストレステストは、同時トレーニングのジョブトラフィックであっても、6.6 TIB/sの総読み取りスループットを達成しました。 smallpondフレームワーク 3FSを補完するように設計された
- Smallpondは、軽量の分散データ処理フレームワークです。 DuckDBを計算エンジンとして使用し、分散ファイルシステム(3FSなど)にParquet形式でデータを保存します。 キー天然pond
ハイパフォーマンス:
duckdbは、効率的なデータ処理のためにネイティブレベルのパフォーマンスを提供します。 スケーラビリティ:高性能分散ファイルシステムのおかげで、メモリボトルネックなしのペタバイトスケールデータを処理します。
シンプルさ:長期にわたるサービスや複雑な依存関係がないため、簡単な展開とメンテナンス。
- 効率的なデータ処理:大規模なデータセットをソートするための2フェーズアプローチにより、パフォーマンスと効率が向上します(たとえば、30分未満で8,192のパーティションで110.5 TIBをソートします)。
- シームレスな3FS統合:レバレッジ3FSの高スループットと強い一貫性。
- クイックスタート:3FSおよびSMALDPOND 3FSインストール
- リポジトリをクローンし、依存関係をインストールします:
-
git clone https://github.com/deepseek-ai/3fs
-
cd 3fs
-
git submodule update --init --recursive
-
./patches/apply.sh
詳細については、3FSドキュメントを参照してください。
smallpond Quick Start
-
Python 3.8がインストールされていることを確認してください
- smallpondをインストールする:
pip install smallpond
- Smallpondセッションの初期化:
import smallpond; sp = smallpond.init()
- 寄木細工データを読み込みます:
df = sp.read_parquet("path/to/dataset/*.parquet")
- 再パーティションデータ(例):
-
df = df.repartition(3)
-
df = df.repartition(3, by_row=True)
-
df = df.repartition(3, hash_by="host")
-
- データの変換(例):
-
df = df.map('a b as c')
-
df = df.map(lambda row: {'c': row['a'] row['b']})
-
- データの保存:
df.write_parquet("path/to/output/dataset.parquet")
- 天然のジョブを実行する:
sp.run(df)
要約
3FSおよびSmallpondのオープンソースリリースは、データ処理の大幅な進歩を表しています。彼らの高いパフォーマンス、使いやすさ、一貫性が開発者と研究者に力を与えます。 これらのツールは、最新のデータ集約型アプリケーションに強力なインフラストラクチャを提供します。
-
以上がDeepseekは3FSとSmallpondフレームワークをリリースしますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ChatGptはアクセスできませんか?この記事では、さまざまな実用的なソリューションを提供しています!多くのユーザーは、ChatGPTを毎日使用する場合、アクセス不能や応答が遅いなどの問題に遭遇する可能性があります。この記事では、さまざまな状況に基づいてこれらの問題を段階的に解決するように導きます。 ChatGPTのアクセス不能性と予備的なトラブルシューティングの原因 まず、問題がOpenaiサーバー側にあるのか、ユーザー自身のネットワークまたはデバイスの問題にあるのかを判断する必要があります。 以下の手順に従って、トラブルシューティングしてください。 ステップ1:OpenAIの公式ステータスを確認してください OpenAIステータスページ(status.openai.com)にアクセスして、ChatGPTサービスが正常に実行されているかどうかを確認してください。赤または黄色のアラームが表示されている場合、それは開くことを意味します

2025年5月10日、MIT物理学者のMax Tegmarkは、AI Labsが人工的なスーパーインテリジェンスを解放する前にOppenheimerの三位一体計算をエミュレートすべきだとGuardianに語った。 「私の評価では、「コンプトン定数」、競争が

AI Music Creation Technologyは、1日ごとに変化しています。この記事では、ChatGPTなどのAIモデルを例として使用して、AIを使用して音楽の作成を支援し、実際のケースで説明する方法を詳細に説明します。 Sunoai、Hugging Face、PythonのMusic21 Libraryを通じて音楽を作成する方法を紹介します。 これらのテクノロジーを使用すると、誰もがオリジナルの音楽を簡単に作成できます。ただし、AIに生成されたコンテンツの著作権問題は無視できないことに注意する必要があります。使用する際には注意する必要があります。 音楽分野でのAIの無限の可能性を一緒に探りましょう! Openaiの最新のAIエージェント「Openai Deep Research」が紹介します。 [chatgpt] ope

ChATGPT-4の出現により、AIアプリケーションの可能性が大幅に拡大しました。 GPT-3.5と比較して、CHATGPT-4は大幅に改善されました。強力なコンテキスト理解能力を備えており、画像を認識して生成することもできます。普遍的なAIアシスタントです。それは、ビジネス効率の改善や創造の支援など、多くの分野で大きな可能性を示しています。ただし、同時に、その使用における予防策にも注意を払わなければなりません。 この記事では、ChATGPT-4の特性を詳細に説明し、さまざまなシナリオの効果的な使用方法を紹介します。この記事には、最新のAIテクノロジーを最大限に活用するためのスキルが含まれています。参照してください。 Openaiの最新のAIエージェント、「Openai Deep Research」の詳細については、以下のリンクをクリックしてください

ChatGPTアプリ:AIアシスタントで創造性を解き放つ!初心者向けガイド ChatGPTアプリは、文章作成、翻訳、質問応答など、多様なタスクに対応する革新的なAIアシスタントです。創作活動や情報収集にも役立つ、無限の可能性を秘めたツールです。 この記事では、ChatGPTスマホアプリのインストール方法から、音声入力機能やプラグインといったアプリならではの機能、そしてアプリ利用上の注意点まで、初心者にも分かりやすく解説します。プラグインの制限やデバイス間の設定同期についてもしっかりと触れていきま

Chatgpt中国語版:中国語のAIの対話の新しい体験のロックを解除する ChatGptは世界中で人気がありますが、中国語版も提供していることをご存知ですか?この強力なAIツールは、毎日の会話をサポートするだけでなく、プロのコンテンツを処理し、簡素化された伝統的な中国語と互換性があります。中国のユーザーであろうと、中国語を学んでいる友人であろうと、あなたはそれから利益を得ることができます。 この記事では、アカウント設定、中国語の迅速な単語入力、フィルターの使用、さまざまなパッケージの選択を含むChatGpt中国語のバージョンの使用方法を詳細に紹介し、潜在的なリスクと対応戦略を分析します。さらに、ChatGpt中国語版を他の中国のAIツールと比較して、その利点とアプリケーションシナリオをよりよく理解するのに役立ちます。 Openaiの最新のAIインテリジェンス

これらは、生成AIの分野で次の飛躍と考えることができ、ChatGptやその他の大規模なモデルのチャットボットを提供しました。単に質問に答えたり情報を生成したりするのではなく、彼らは私たちに代わって行動を起こすことができます。

ChatGPTを活用した効率的な複数アカウント管理術|ビジネスとプライベートの使い分けも徹底解説! 様々な場面で活用されているChatGPTですが、複数アカウントの管理に頭を悩ませている方もいるのではないでしょうか。この記事では、ChatGPTの複数アカウント作成方法、利用上の注意点、そして安全かつ効率的な運用方法を詳しく解説します。ビジネス利用とプライベート利用の使い分け、OpenAIの利用規約遵守といった重要な点にも触れ、複数アカウントを安全に活用するためのガイドを提供します。 OpenAI


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

SublimeText3 英語版
推奨: Win バージョン、コードプロンプトをサポート!

PhpStorm Mac バージョン
最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

SAP NetWeaver Server Adapter for Eclipse
Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

Safe Exam Browser
Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。

WebStorm Mac版
便利なJavaScript開発ツール
