Maison >développement back-end >Tutoriel Python >Comment effectuer l'équivalent SQL \'count(distinct)\' dans Pandas en utilisant \'nunique()\' ?

Comment effectuer l'équivalent SQL \'count(distinct)\' dans Pandas en utilisant \'nunique()\' ?

Barbara Streisand
Barbara Streisandoriginal
2024-10-23 13:28:29416parcourir

How to Perform SQL 'count(distinct)' Equivalent in Pandas using 'nunique()'?

Équivalent de requête SQL dans Pandas en utilisant 'count(distinct)'

En SQL, le comptage de valeurs distinctes dans une colonne peut être obtenu en utilisant le Fonction 'count(distinct)'. Par exemple, pour compter les codes clients uniques par an et mois :

<code class="sql">SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;</code>

Une opération similaire peut être effectuée dans Pandas en utilisant la méthode 'nunique()' sur un DataFrame groupé. En regroupant les données par la colonne 'YEARMONTH' puis en appelant 'nunique()' sur la colonne 'CLIENTCODE', on peut obtenir le nombre de clients uniques par an mois.

<code class="python">table.groupby('YEARMONTH').CLIENTCODE.nunique()</code>

Exemple :

Considérez une « table » DataFrame contenant les colonnes suivantes :

CLIENTCODE YEARMONTH
1 201301
1 201301
2 201301
1 201302
2 201302
2 201302
3 201302

L'application du code susmentionné donne :

<code class="python">Out[3]: 
YEARMONTH
201301       2
201302       3</code>

Cette sortie correspond à l'attendu résultat, montrant le nombre de clients uniques pour chaque mois de l'année.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn