Maison >développement back-end >Tutoriel Python >Comment effectuer l'équivalent SQL \'count(distinct)\' dans Pandas en utilisant \'nunique()\' ?
Équivalent de requête SQL dans Pandas en utilisant 'count(distinct)'
En SQL, le comptage de valeurs distinctes dans une colonne peut être obtenu en utilisant le Fonction 'count(distinct)'. Par exemple, pour compter les codes clients uniques par an et mois :
<code class="sql">SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;</code>
Une opération similaire peut être effectuée dans Pandas en utilisant la méthode 'nunique()' sur un DataFrame groupé. En regroupant les données par la colonne 'YEARMONTH' puis en appelant 'nunique()' sur la colonne 'CLIENTCODE', on peut obtenir le nombre de clients uniques par an mois.
<code class="python">table.groupby('YEARMONTH').CLIENTCODE.nunique()</code>
Exemple :
Considérez une « table » DataFrame contenant les colonnes suivantes :
CLIENTCODE | YEARMONTH |
---|---|
1 | 201301 |
1 | 201301 |
2 | 201301 |
1 | 201302 |
2 | 201302 |
2 | 201302 |
3 | 201302 |
L'application du code susmentionné donne :
<code class="python">Out[3]: YEARMONTH 201301 2 201302 3</code>
Cette sortie correspond à l'attendu résultat, montrant le nombre de clients uniques pour chaque mois de l'année.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!