Maison >interface Web >js tutoriel >Danfo js - Une alternative aux pandas

Danfo js - Une alternative aux pandas

Mary-Kate Olsen
Mary-Kate Olsenoriginal
2025-01-03 07:34:38248parcourir

Danfo js — An Alternative to Pandas

JavaScript est devenu l'un des langages de programmation les plus polyvalents, et avec des bibliothèques comme Danfo.js, il est encore plus puissant pour les tâches de science des données. Si vous débutez dans la manipulation de données en JavaScript, ce guide vous présentera Danfo.js et vous aidera à démarrer avec une gestion efficace des données.

Qu’est-ce que Danfo.js ?

Danfo.js est une bibliothèque puissante construite sur JavaScript qui permet aux utilisateurs d'effectuer des manipulations et des analyses de données, de la même manière que ce que fait la bibliothèque Pandas de Python. Il est conçu pour fonctionner avec les DataFrames et Series, qui sont les deux principales structures de données qui vous permettent de gérer les données sous forme de tableau. Si vous avez déjà travaillé avec des feuilles de calcul ou des bases de données, ces concepts vous seront familiers.

Pourquoi Danfo.js ?

JavaScript pour la science des données : Si vous êtes déjà familier avec JavaScript mais que vous souhaitez vous plonger dans la manipulation de données, Danfo.js est un excellent outil. Il combine la puissance de JavaScript avec la flexibilité de l'analyse des données.
Facile à apprendre : Si vous êtes débutant, Danfo.js est simple à prendre en main, surtout si vous êtes à l'aise avec JavaScript. Il vous permet d'effectuer facilement des tâches telles que le filtrage, le regroupement et la transformation des données.
Intégration avec les applications Web : Danfo.js vous permet de travailler de manière transparente avec les données dans les applications Web. Vous pouvez récupérer des données à partir d'API ou gérer des ensembles de données locaux directement dans votre navigateur.

Installation de Danfo.js

Pour démarrer avec Danfo.js, vous devrez l'installer. Vous pouvez installer Danfo.js en utilisant npm (Node Package Manager) dans le répertoire de votre projet.

npm install danfojs-node

Pour travailler dans le navigateur, vous pouvez inclure Danfo.js depuis un CDN :

<script src="https://cdn.jsdelivr.net/npm/danfojs@0.5.0/dist/index.min.js"></script>

Travailler avec des DataFrames

Un DataFrame est une structure de données tabulaire bidimensionnelle, à taille variable et potentiellement hétérogène. C'est similaire à un tableau dans une base de données ou une feuille Excel.

Voici un exemple de base de création d'un DataFrame dans Danfo.js :

const dfd = require("danfojs-node"); const data = {
    "Name": ["Alice", "Bob", "Charlie"],
    "Age": [25, 30, 35],
    "Country": ["USA", "UK", "Canada"]
}; const df = new dfd.DataFrame(data);
df.print();

Cela affichera :

Name  Age  Country
0  Alice   25      USA
1    Bob   30       UK
2 Charlie   35   Canada

Opérations courantes dans Danfo.js

Voici quelques-unes des tâches de manipulation de données les plus courantes que vous effectuerez à l'aide de Danfo.js :

1. Sélection des colonnes

Vous pouvez sélectionner une colonne spécifique du DataFrame comme ceci :

const ageColumn = df["Age"];
ageColumn.print();

2. Filtrage des lignes

Pour filtrer les lignes en fonction d'une condition :

const adults = df.query(df['Age'].gt(30)); // Filters rows where age > 30
adults.print();

3. Ajout de nouvelles colonnes

Vous pouvez facilement ajouter une nouvelle colonne basée sur les colonnes existantes :

df.addColumn("IsAdult", df["Age"].gt(18)); // Adds a column based on age
df.print();

4. Gestion des données manquantes

Danfo.js fournit diverses fonctions pour gérer les valeurs manquantes :

npm install danfojs-node

Travailler avec des séries

Une série dans Danfo.js est un objet de type tableau unidimensionnel. Il peut être considéré comme une seule colonne d'un DataFrame.

Voici comment créer et manipuler une série :

<script src="https://cdn.jsdelivr.net/npm/danfojs@0.5.0/dist/index.min.js"></script>

Vous pouvez également effectuer des opérations sur les séries :

const dfd = require("danfojs-node"); const data = {
    "Name": ["Alice", "Bob", "Charlie"],
    "Age": [25, 30, 35],
    "Country": ["USA", "UK", "Canada"]
}; const df = new dfd.DataFrame(data);
df.print();

Visualisation des données

Bien que Danfo.js lui-même ne se concentre pas sur la visualisation, vous pouvez facilement l'intégrer à des bibliothèques comme Plotly ou Chart.js pour visualiser vos données. Après avoir traité vos données dans Danfo.js, vous pouvez les transmettre à une bibliothèque de visualisation pour générer des tableaux et des graphiques.

Le type de visualisation dépend du type de données et du message que vous souhaitez transmettre. Vous trouverez ci-dessous quelques visualisations courantes pour différents types de données :

Graphique à barres

Cas d'utilisation : Comparaison de différentes catégories ou groupes.
Quand l'utiliser : Lorsque vous disposez de données catégorielles et que vous souhaitez comparer les valeurs de différentes catégories.

Name  Age  Country
0  Alice   25      USA
1    Bob   30       UK
2 Charlie   35   Canada

Graphique linéaire

Cas d'utilisation : Visualisation des tendances au fil du temps ou de données continues.
Quand l'utiliser : pour montrer comment une valeur change au fil du temps (données de séries chronologiques) ou des données continues.

const ageColumn = df["Age"];
ageColumn.print();

Graphique circulaire

Cas d'utilisation : Afficher les proportions d'un tout.

Quand utiliser : Lorsque vous souhaitez montrer comment les parties constituent un tout ou comparer les proportions relatives de catégories.

const adults = df.query(df['Age'].gt(30)); // Filters rows where age > 30
adults.print();

Nuage de points

**Cas d'utilisation : **Affichage des relations entre deux variables continues.
Quand l'utiliser : Pour visualiser les corrélations ou les relations entre deux variables numériques.

df.addColumn("IsAdult", df["Age"].gt(18)); // Adds a column based on age
df.print();

Carte thermique

Cas d'utilisation : Visualisation de données matricielles ou de l'intensité des valeurs sur deux dimensions.
**Quand l'utiliser : **Pour afficher des modèles de données qui changent en intensité, comme des matrices de corrélation ou des cartes thermiques géographiques.

df.fillna(0, {inplace: true}); // Replace NaN values with 0

Boîte à moustaches

Cas d'utilisation : Comprendre la distribution d'un ensemble de données.
Quand l'utiliser : Lorsque vous souhaitez visualiser la distribution des données, y compris la médiane, les quartiles et les valeurs aberrantes potentielles.

const ageSeries = new dfd.Series([25, 30, 35]);
ageSeries.print();

Dans l'ensemble, danfo.js est une bibliothèque puissante qui apporte les capacités de manipulation et d'analyse des données à JavaScript, ce qui en fait un choix idéal pour ceux qui sont déjà familiers avec JavaScript et souhaitent se plonger dans les tâches de science des données.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn