Maison >développement back-end >Tutoriel Python >Comment extraire des lignes avec des valeurs distinctes dans un DataFrame Pandas ?
Récupération de lignes de valeurs distinctes
Pour extraire des lignes en fonction de valeurs distinctes dans une colonne, en particulier COL2, les méthodes suivantes peuvent être utilisées :
drop_duplicates avec Keep First :
df = df.drop_duplicates('COL2', keep='first')
Cela conserve la première occurrence de chaque valeur unique dans COL2.
drop_duplicates avec Keep Last :
df = df.drop_duplicates('COL2', keep='last')
Cela conserve la dernière occurrence de chaque valeur unique dans COL2.
drop_duplicates with No Keep :
df = df.drop_duplicates('COL2', keep=False)
Cela supprime toutes les lignes en double, ce qui donne uniquement des valeurs uniques dans COL2.
Exemple :
Considérons le dataframe suivant :
COL1 | COL2 |
---|---|
a.com | 22 |
b.com | 45 |
c.com | 34 |
e.com | 45 |
f.com | 56 |
g.com | 22 |
h.com | 45 |
L'utilisation de la méthode keep_first produit :
COL1 | COL2 |
---|---|
a.com | 22 |
b.com | 45 |
c.com | 34 |
f.com | 56 |
La méthode keep_last donne :
COL1 | COL2 |
---|---|
c.com | 34 |
f.com | 56 |
g.com | 22 |
h.com | 45 |
Enfin, l'utilisation de la méthode keep_false produit :
COL1 | COL2 |
---|---|
c.com | 34 |
f.com | 56 |
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!