Maison >développement back-end >Tutoriel Python >Comment puis-je regrouper et additionner les données dans Pandas pour calculer le total des achats par client et par type de fruit ?

Comment puis-je regrouper et additionner les données dans Pandas pour calculer le total des achats par client et par type de fruit ?

Barbara Streisand
Barbara Streisandoriginal
2024-12-25 14:55:15341parcourir

How Can I Group and Sum Data in Pandas to Calculate Total Purchases by Customer and Fruit Type?

Regrouper et additionner les données dans Pandas

Dans l'analyse des données, il est souvent nécessaire d'agréger les données selon des critères spécifiques pour en tirer des informations significatives. Pandas, une puissante bibliothèque Python pour la manipulation de données, fournit la méthode groupby() pour regrouper les données en fonction d'une ou plusieurs colonnes. Cette méthode peut être combinée avec des fonctions d'agrégation, telles que sum(), pour calculer les valeurs agrégées pour chaque groupe.

Calcul de la somme des valeurs par groupe

Supposons que nous disposer d’un DataFrame contenant des informations sur la consommation de fruits par les individus. Chaque ligne représente un achat de fruit, y compris le type de fruit, la date d'achat, le nom du client et le nombre de fruits achetés.

Pour calculer le nombre total de fruits achetés par chaque individu, regroupés par type de fruit et par nom de client. , nous pouvons utiliser les étapes suivantes :

Étape 1 : Regrouper les données

Tout d'abord, nous regroupons le DataFrame à la fois par le Colonnes « Fruit » et « Nom » à l'aide de la méthode groupby() :

df_grouped = df.groupby(['Fruit', 'Name'])

Cela crée un objet SeriesGroupBy, qui représente les données groupées.

Étape 2 : Appliquez le Fonction Somme

Pour calculer le nombre total de fruits achetés par chaque groupe, nous appliquons la fonction sum() aux fruits groupés Série :

df_grouped_sum = df_grouped['Number'].sum()

La série résultante, df_grouped_sum, contient la somme des achats de fruits pour chaque combinaison unique de type de fruit et de nom de client.

Exemple

Considérez le DataFrame suivant :

   Fruit   Date      Name  Number
Apples  10/6/2016 Bob    7
Apples  10/6/2016 Bob    8
Apples  10/6/2016 Mike   9
Apples  10/7/2016 Steve 10
Apples  10/7/2016 Bob    1
Oranges 10/7/2016 Bob    2
Oranges 10/6/2016 Tom   15
Oranges 10/6/2016 Mike  57
Oranges 10/6/2016 Bob   65
Oranges 10/7/2016 Tony   1
Grapes  10/7/2016 Bob    1
Grapes  10/7/2016 Tom   87
Grapes  10/7/2016 Bob   22
Grapes  10/7/2016 Bob   12
Grapes  10/7/2016 Tony  15

Application de groupby() et sum() opérations sur ce DataFrame, nous obtenons le résultat suivant :

                 Number
Fruit   Name         
Apples  Bob        16
        Mike        9
        Steve      10
Grapes  Bob        35
        Tom        87
        Tony       15
Oranges Bob        67
        Mike       57
        Tom        15
        Tony        1

Cette sortie montre le nombre total de fruits achetés par chaque individu, ventilé par type de fruit.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn