Maison >développement back-end >Tutoriel Python >Comment compter la fréquence des lignes en fonction de plusieurs colonnes dans un DataFrame Pandas ?
Obtenez un décompte de fréquence basé sur plusieurs colonnes de trames de données
Pour trouver la fréquence des lignes qui apparaissent plusieurs fois dans une trame de données, vous pouvez utiliser l'opération groupby avec des fonctions de taille ou de nombre. Montrons cela avec un exemple de dataframe :
import pandas as pd # Sample dataframe data = {'Group': ['Short', 'Short', 'Moderate', 'Moderate', 'Tall'], 'Size': ['Small', 'Small', 'Medium', 'Small', 'Large']} df = pd.DataFrame(data)
Option 1 : Utiliser groupby et size
dfg = df.groupby(['Group', 'Size']).size() print(dfg)
Sortie :
Group Size Moderate Medium 1 Small 1 Short Small 2 Tall Large 1 dtype: int64
Option 2 : Utiliser groupby, size et reset_index
dfg = df.groupby(['Group', 'Size']).size().reset_index(name='Time') print(dfg)
Sortie :
Group Size Time 0 Moderate Medium 1 1 Moderate Small 1 2 Short Small 2 3 Tall Large 1
Option 3 : Utiliser groupby, size et as_index
dfg = df.groupby(['Group', 'Size'], as_index=False).size() print(dfg)
Sortie :
Group Size Time 0 Moderate Medium 1 1 Moderate Small 1 2 Short Small 2 3 Tall Large 1
Chaque option renvoie un cadre de données avec des colonnes Groupe et Taille, indiquant les combinaisons de lignes spécifiques qui apparaissent dans le cadre de données d'origine. Une colonne Temps supplémentaire affiche le nombre de fréquences pour chaque combinaison.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!