Maison  >  Article  >  développement back-end  >  Comment regrouper Pandas DataFrame par deux colonnes et compter les observations ?

Comment regrouper Pandas DataFrame par deux colonnes et compter les observations ?

DDD
DDDoriginal
2024-10-23 10:56:12584parcourir

How to Group Pandas DataFrame by Two Columns and Count Observations?

Pandas DataFrame : regroupement par deux colonnes et comptage des observations

Dans l'analyse des données, il devient souvent nécessaire de regrouper les données en fonction de colonnes spécifiques et compter le nombre d’observations au sein de chaque groupe. Pour y parvenir à l'aide de Pandas DataFrame, examinons le problème suivant.

Énoncé du problème :

Considérons un Pandas DataFrame avec plusieurs colonnes. L'objectif est de regrouper le DataFrame en fonction de deux colonnes, à savoir « col5 » et « col2 », et de compter le nombre de lignes uniques au sein de chaque groupe. De plus, nous souhaitons déterminer le plus grand nombre pour chaque valeur 'col2'.

Solution :

Pour regrouper le DataFrame et compter les lignes dans chaque groupe, nous pouvons utilisez la fonction Pandas groupby(). Voici une approche étape par étape :

Étape 1 : Regroupez le DataFrame

Regroupez le DataFrame par colonnes 'col5' et 'col2' :

<code class="python">grouped_df = df.groupby(['col5', 'col2'])</code>

Étape 2 : Compter les lignes

Appliquez la fonction size() sur le DataFrame groupé pour compter le nombre de lignes uniques dans chaque groupe :

<code class="python">counts = grouped_df.size()</code>

Étape 3 : Trouver le nombre maximum pour chaque « col2 »

Pour trouver le plus grand nombre pour chaque valeur « col2 », nous pouvons regrouper davantage les comptes DataFrame par « col2 », puis appliquez la fonction max() :

<code class="python">max_counts = counts.groupby(level=1).max()</code>

Sortie :

Les étapes ci-dessus nous fourniront deux DataFrames distincts :

  • counts : affiche le nombre de lignes uniques pour chaque groupe.
  • max_counts : affiche le nombre maximum pour chaque valeur « col2 ».

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn