Maison >développement back-end >Tutoriel Python >Comment puis-je compter efficacement les fréquences de valeurs dans une colonne Pandas DataFrame ?
Recherche de la fréquence des valeurs dans une colonne DataFrame
Dans l'analyse des données, il est souvent nécessaire de compter la fréquence d'apparition des valeurs dans une colonne spécifique d'un DataFrame. Pour y parvenir, pandas fournit plusieurs fonctions.
Une approche courante consiste à utiliser la méthode value_counts(). Par exemple, étant donné le DataFrame :
category | |
---|---|
cat | a |
cat | b |
cat | a |
L'utilisation de value_counts() renvoie les valeurs uniques et leurs fréquences :
df = pd.DataFrame({'category': ['cat a', 'cat b', 'cat a']}) df['category'].value_counts()
Sortie :
category | freq |
---|---|
cat a | 2 |
cat b | 1 |
Une autre méthode consiste à utiliser les fonctions groupby() et count(). Cette approche regroupe le DataFrame par colonne d'intérêt et compte les occurrences pour chaque valeur au sein du groupe :
df.groupby('category').count()
Sortie :
category | count |
---|---|
cat a | 2 |
cat b | 1 |
Enfin, pour rajouter la fréquence à la DataFrame original, on peut utiliser la fonction transform() pour créer une nouvelle colonne contenant les fréquences :
df['freq'] = df.groupby('category')['category'].transform('count')
Il en résulte ce qui suit DataFrame :
category | freq | |
---|---|---|
cat | a | 2 |
cat | b | 1 |
cat | a | 2 |
En tirant parti de ces méthodes, les analystes de données peuvent analyser efficacement la fréquence des valeurs dans les colonnes DataFrame, fournissant ainsi des informations précieuses pour la prise de décision.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!