recherche
MaisonPériphériques technologiquesIADeepseek publie un cadre 3FS et SmallPond

DeepSeek Releases 3FS & Smallpond Framework

Deepseek a considérablement augmenté les capacités des open source le 28 février 2025, dévoilant le système de fichiers de vol de feu (3FS) et le cadre de traitement des données à petit. Ces outils sont conçus pour révolutionner l'accès et le traitement des données, en particulier pour la formation et l'inférence en IA.

? Jour 5 de #OpenSourceweek: 3FS, un moteur puissant pour tout accès aux données Deepseek.

Système de fichiers Fire-Flyer (3FS) - Un système de fichiers parallèle maximisant la bande passante des SSD modernes et des réseaux RDMA.

⚡ 6.6 Tib / s Aggrégat Lire le débit (cluster de 180 nœuds) ⚡ 3,66 tib / min…

- Deepseek (@deepseek_ai) 28 février 2025

Table des matières

  • Système de fichiers Fire-Flyer (3FS)
  • Framework à petits étangs
  • Démarrage rapide: 3FS et à petite étang
  • Dépannage et surveillance
  • Résumé

Système de fichiers Fire-Flyer (3FS)

3FS est un système de fichiers distribué haute performance construit pour les SSD modernes et les réseaux RDMA. Il offre une solution de stockage partagée robuste, simplifiant le développement d'applications distribuées.

Comprendre RDMA

> L'accès à la mémoire directe à distance (RDMA) contourne les limitations du système d'exploitation, permettant un transfert de données direct entre la mémoire de deux ordinateurs. Il en résulte une communication plus rapide et plus efficace.

Clé des fonctionnalités 3FS

  • Performances inégalées et facilité d'utilisation:
    • 6.6 TIB / s Aggrégat Lire le débit (cluster de 180 nœuds).
    • 3,66 débit TIB / min sur la référence GraySort (cluster de 25 nœuds).
    • 40 Gib / s Péper à maturité par nœud client pour les recherches kvcache.
  • Architecture désagrégée:
    • combine le débit de milliers de SSD avec la bande passante du réseau de centaines de nœuds de stockage.
    • offre un accès au stockage obligatoire pour la localité pour les applications.
  • cohérence robuste:
    • utilise la réplication de la chaîne avec des requêtes réparties (CRAQ) pour une forte cohérence, simplifiant le codage de l'application.
  • Interfaces de fichier standard:
    • utilise des services de métadonnées apatrides basés sur un magasin de valeurs de clé transactionnel (par exemple, FoundationDB).
    • maintient une interface de fichiers familière, éliminant la nécessité d'un nouvel apprentissage de l'API.

charges de travail prises en charge

  • Préparation des données: Gère efficacement de grands volumes de sorties intermédiaires des pipelines d'analyse de données.
  • DatalOaders: permet un accès aléatoire à des échantillons de formation sur les nœuds de calcul, éliminant la préfecture ou les mélanges de données.
  • Points de contrôle: prend en charge le point de contrôle parallèle à haut débit pour une formation à grande échelle.
  • kvcache pour l'inférence: offre une alternative rentable et élevée à la mise en cache basée sur le DRAM avec une capacité considérablement accrue.

Benchmarks de performance

Les tests approfondis valident les performances de 3FS. Un test de stress de lecture sur un grand cluster a atteint le débit de lecture globale de 6,6 TIB / s, même avec un trafic professionnel de formation simultané.

Framework à petits étangs

SallPond, conçu pour compléter 3FS, est un cadre de traitement des données léger et distribué. Il utilise DuckDB comme moteur de calcul et stocke les données au format parquet sur un système de fichiers distribué (comme 3fs).

Clé des caractéristiques à petits étangs

  • Haute performance: DuckDB fournit des performances au niveau natif pour un traitement efficace des données.
  • Évolutivité: gère les données à l'échelle des pétaoctets sans goulot d'étranglement de mémoire grâce aux systèmes de fichiers distribués haute performance.
  • Simplicité: Déploiement et maintenance faciles en raison de l'absence de services de longue durée ou de dépendances complexes.
  • Traitement efficace des données: Une approche biphasée pour trier les grands ensembles de données améliore les performances et l'efficacité (par exemple, trié 110,5 TIB sur 8 192 partitions en moins de 30 minutes).
  • Intégration 3FS sans couture: exploite le débit élevé de 3FS et la forte cohérence.

Démarrage rapide: 3FS et à petite étang

3fs Installation

Clone Les dépendances du référentiel et d'installation:

  1. git clone https://github.com/deepseek-ai/3fs
  2. cd 3fs
  3. git submodule update --init --recursive
  4. ./patches/apply.sh

Consultez la documentation 3FS pour plus de détails.

Démarrage rapide de SallPond

  • Assurez-vous que Python 3.8 est installé.

  • Installez à petite étang: pip install smallpond

  • Initialiser une session à petite étang: import smallpond; sp = smallpond.init()

  • Chargez des données de parquet: df = sp.read_parquet("path/to/dataset/*.parquet")

  • Données de répartition (exemples):

    • df = df.repartition(3)
    • df = df.repartition(3, by_row=True)
    • df = df.repartition(3, hash_by="host")
  • Transformer les données (exemples):

    • df = df.map('a b as c')
    • df = df.map(lambda row: {'c': row['a'] row['b']})
  • Enregistrer les données: df.write_parquet("path/to/output/dataset.parquet")

  • Exécutez un travail à petite étang: sp.run(df)

Dépannage et surveillance

SmallPond propose des outils de surveillance et de débogage. L'analyse des journaux aide à résoudre les problèmes d'exécution. La documentation complète, les tutoriels et les cas d'utilisation sont disponibles via les canaux de support officiels.

Résumé

La version open source de 3FS et de SmallPond représente une progression significative dans le traitement des données. Leurs hautes performances, leur facilité d'utilisation et leur cohérence permettent aux développeurs et aux chercheurs. Ces outils fournissent une infrastructure puissante pour les applications modernes à forte intensité de données.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Gemma Scope: le microscope de Google pour regarder dans le processus de pensée de l'IAGemma Scope: le microscope de Google pour regarder dans le processus de pensée de l'IAApr 17, 2025 am 11:55 AM

Explorer le fonctionnement interne des modèles de langue avec Gemma Scope Comprendre les complexités des modèles de langue IA est un défi important. La sortie de Google de Gemma Scope, une boîte à outils complète, offre aux chercheurs un moyen puissant de plonger

Qui est un analyste de Business Intelligence et comment en devenir un?Qui est un analyste de Business Intelligence et comment en devenir un?Apr 17, 2025 am 11:44 AM

Déverrouiller le succès de l'entreprise: un guide pour devenir un analyste de Business Intelligence Imaginez transformer les données brutes en informations exploitables qui stimulent la croissance organisationnelle. C'est le pouvoir d'un analyste de Business Intelligence (BI) - un rôle crucial dans GU

Comment ajouter une colonne dans SQL? - Analytique VidhyaComment ajouter une colonne dans SQL? - Analytique VidhyaApr 17, 2025 am 11:43 AM

Instruction ALTER TABLE de SQL: Ajout de colonnes dynamiquement à votre base de données Dans la gestion des données, l'adaptabilité de SQL est cruciale. Besoin d'ajuster votre structure de base de données à la volée? L'énoncé de la table alter est votre solution. Ce guide détaille l'ajout de Colu

Analyste d'entreprise vs analyste de donnéesAnalyste d'entreprise vs analyste de donnéesApr 17, 2025 am 11:38 AM

Introduction Imaginez un bureau animé où deux professionnels collaborent sur un projet critique. L'analyste commercial se concentre sur les objectifs de l'entreprise, l'identification des domaines d'amélioration et la garantie d'alignement stratégique sur les tendances du marché. Simulé

Que sont le comte et le coude à Excel? - Analytique VidhyaQue sont le comte et le coude à Excel? - Analytique VidhyaApr 17, 2025 am 11:34 AM

Excel Counting and Analysis: Explication détaillée du nombre et des fonctions de compte Le comptage et l'analyse des données précises sont essentiels dans Excel, en particulier lorsque vous travaillez avec de grands ensembles de données. Excel fournit une variété de fonctions pour y parvenir, les fonctions Count et Count sont des outils clés pour compter le nombre de cellules dans différentes conditions. Bien que les deux fonctions soient utilisées pour compter les cellules, leurs cibles de conception sont ciblées sur différents types de données. Faisons des détails spécifiques du comptage et des fonctions de coude, mettons en évidence leurs caractéristiques et différences uniques et apprenez à les appliquer dans l'analyse des données. Aperçu des points clés Comprendre le nombre et le cou

Chrome est là avec l'IA: vivre quelque chose de nouveau tous les jours !!Chrome est là avec l'IA: vivre quelque chose de nouveau tous les jours !!Apr 17, 2025 am 11:29 AM

La révolution de l'IA de Google Chrome: une expérience de navigation personnalisée et efficace L'intelligence artificielle (IA) transforme rapidement notre vie quotidienne, et Google Chrome mène la charge dans l'arène de navigation Web. Cet article explore les exciti

Côté humain de l'AI: le bien-être et le quadruple de basCôté humain de l'AI: le bien-être et le quadruple de basApr 17, 2025 am 11:28 AM

Réinventuation d'impact: le quadruple bas Pendant trop longtemps, la conversation a été dominée par une vision étroite de l’impact de l’IA, principalement axée sur le résultat du profit. Cependant, une approche plus holistique reconnaît l'interconnexion de BU

5 cas d'utilisation de l'informatique quantique qui change la donne que vous devriez connaître5 cas d'utilisation de l'informatique quantique qui change la donne que vous devriez connaîtreApr 17, 2025 am 11:24 AM

Les choses évoluent régulièrement vers ce point. L'investissement affluant dans les prestataires de services quantiques et les startups montre que l'industrie comprend son importance. Et un nombre croissant de cas d'utilisation réels émergent pour démontrer sa valeur

See all articles

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
1 Il y a quelques moisBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
1 Il y a quelques moisBy尊渡假赌尊渡假赌尊渡假赌
Will R.E.P.O. Vous avez un jeu croisé?
1 Il y a quelques moisBy尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

Télécharger la version Mac de l'éditeur Atom

Télécharger la version Mac de l'éditeur Atom

L'éditeur open source le plus populaire

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

DVWA

DVWA

Damn Vulnerable Web App (DVWA) est une application Web PHP/MySQL très vulnérable. Ses principaux objectifs sont d'aider les professionnels de la sécurité à tester leurs compétences et leurs outils dans un environnement juridique, d'aider les développeurs Web à mieux comprendre le processus de sécurisation des applications Web et d'aider les enseignants/étudiants à enseigner/apprendre dans un environnement de classe. Application Web sécurité. L'objectif de DVWA est de mettre en pratique certaines des vulnérabilités Web les plus courantes via une interface simple et directe, avec différents degrés de difficulté. Veuillez noter que ce logiciel