Maison >développement back-end >Tutoriel Python >Comment puis-je regrouper et additionner les données dans Pandas pour calculer le total des achats par client et par type de fruit ?
Regrouper et additionner les données dans Pandas
Dans l'analyse des données, il est souvent nécessaire d'agréger les données selon des critères spécifiques pour en tirer des informations significatives. Pandas, une puissante bibliothèque Python pour la manipulation de données, fournit la méthode groupby() pour regrouper les données en fonction d'une ou plusieurs colonnes. Cette méthode peut être combinée avec des fonctions d'agrégation, telles que sum(), pour calculer les valeurs agrégées pour chaque groupe.
Calcul de la somme des valeurs par groupe
Supposons que nous disposer d’un DataFrame contenant des informations sur la consommation de fruits par les individus. Chaque ligne représente un achat de fruit, y compris le type de fruit, la date d'achat, le nom du client et le nombre de fruits achetés.
Pour calculer le nombre total de fruits achetés par chaque individu, regroupés par type de fruit et par nom de client. , nous pouvons utiliser les étapes suivantes :
Étape 1 : Regrouper les données
Tout d'abord, nous regroupons le DataFrame à la fois par le Colonnes « Fruit » et « Nom » à l'aide de la méthode groupby() :
df_grouped = df.groupby(['Fruit', 'Name'])
Cela crée un objet SeriesGroupBy, qui représente les données groupées.
Étape 2 : Appliquez le Fonction Somme
Pour calculer le nombre total de fruits achetés par chaque groupe, nous appliquons la fonction sum() aux fruits groupés Série :
df_grouped_sum = df_grouped['Number'].sum()
La série résultante, df_grouped_sum, contient la somme des achats de fruits pour chaque combinaison unique de type de fruit et de nom de client.
Exemple
Considérez le DataFrame suivant :
Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1 Grapes 10/7/2016 Bob 1 Grapes 10/7/2016 Tom 87 Grapes 10/7/2016 Bob 22 Grapes 10/7/2016 Bob 12 Grapes 10/7/2016 Tony 15
Application de groupby() et sum() opérations sur ce DataFrame, nous obtenons le résultat suivant :
Number Fruit Name Apples Bob 16 Mike 9 Steve 10 Grapes Bob 35 Tom 87 Tony 15 Oranges Bob 67 Mike 57 Tom 15 Tony 1
Cette sortie montre le nombre total de fruits achetés par chaque individu, ventilé par type de fruit.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!