Maison >développement back-end >Tutoriel Python >Comment puis-je compter efficacement les fréquences de valeurs dans une colonne Pandas DataFrame ?

Comment puis-je compter efficacement les fréquences de valeurs dans une colonne Pandas DataFrame ?

DDD
DDDoriginal
2024-12-15 12:30:24925parcourir

How Can I Efficiently Count Value Frequencies in a Pandas DataFrame Column?

Recherche de la fréquence des valeurs dans une colonne DataFrame

Dans l'analyse des données, il est souvent nécessaire de compter la fréquence d'apparition des valeurs dans une colonne spécifique d'un DataFrame. Pour y parvenir, pandas fournit plusieurs fonctions.

Une approche courante consiste à utiliser la méthode value_counts(). Par exemple, étant donné le DataFrame :

category
cat a
cat b
cat a

L'utilisation de value_counts() renvoie les valeurs uniques et leurs fréquences :

df = pd.DataFrame({'category': ['cat a', 'cat b', 'cat a']})
df['category'].value_counts()

Sortie :

category freq
cat a 2
cat b 1

Une autre méthode consiste à utiliser les fonctions groupby() et count(). Cette approche regroupe le DataFrame par colonne d'intérêt et compte les occurrences pour chaque valeur au sein du groupe :

df.groupby('category').count()

Sortie :

category count
cat a 2
cat b 1

Enfin, pour rajouter la fréquence à la DataFrame original, on peut utiliser la fonction transform() pour créer une nouvelle colonne contenant les fréquences :

df['freq'] = df.groupby('category')['category'].transform('count')

Il en résulte ce qui suit DataFrame :

category freq
cat a 2
cat b 1
cat a 2

En tirant parti de ces méthodes, les analystes de données peuvent analyser efficacement la fréquence des valeurs dans les colonnes DataFrame, fournissant ainsi des informations précieuses pour la prise de décision.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn