Maison >développement back-end >Tutoriel Python >Comment supprimer les doublons consécutifs dans une série Pandas ?

Comment supprimer les doublons consécutifs dans une série Pandas ?

Mary-Kate Olsen
Mary-Kate Olsenoriginal
2024-11-13 01:49:02410parcourir

How to Remove Consecutive Duplicates in a Pandas Series?

Suppression des doublons consécutifs dans Pandas

Pour supprimer les doublons consécutifs d'une série pandas, plusieurs méthodes peuvent être utilisées.

Méthode 1 : Utiliser Shift

L'approche la plus efficace consiste à exploiter la fonction shift() :

a.loc[a.shift() != a]

Cette méthode compare la série à sa propre version décalée, créer un masque booléen où les doublons consécutifs sont identifiés.

Méthode 2 : Utiliser Diff

Une méthode alternative consiste à utiliser la fonction diff() :

a.loc[a.diff() != 0]

Cependant, cette approche est légèrement plus lente pour les grands ensembles de données.

Mise à jour :

Il est important de noter que l'utilisation de shift() avec une période par défaut de 1 équivaut à shift(1). Par conséquent, le code suivant produit également le résultat souhaité :

a.loc[a.shift(1) != a]

En utilisant ces méthodes, vous pouvez supprimer efficacement les doublons consécutifs de la série pandas, en garantissant que seules les valeurs distinctes sont conservées.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn