Maison >développement back-end >Tutoriel Python >Comment supprimer efficacement les colonnes en double dans Pandas ?

Comment supprimer efficacement les colonnes en double dans Pandas ?

Patricia Arquetteoriginal: 2024-11-04 20:38:01840parcourir

How to Efficiently Remove Duplicate Columns in Pandas?

Suppression efficace des colonnes en double dans Pandas

Lorsque vous travaillez avec des données dans un dataframe, il est souvent nécessaire de supprimer les colonnes en double pour garantir l'intégrité des données et l'efficacité. Dans Pandas, il existe une solution élégante à ce problème.

Suppression des noms de colonnes en double

Supposons que vous ayez une trame de données avec des colonnes nommées « Time », « Time Relative », et plusieurs instances de « Time ». Pour supprimer les noms de colonnes en double, utilisez le code suivant :

<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>

Cette approche vérifie les noms de colonnes en double et ne conserve que les noms uniques.

Suppression des doublons en fonction des valeurs

Dans certains cas, vous devrez peut-être supprimer les colonnes en double en fonction de leurs valeurs. C'est exactement ce que fait le code suivant :

<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>

Ce code applique une fonction lambda à chaque colonne, vérifiant les valeurs en double. Si toutes les valeurs d'une colonne sont uniques, la colonne est conservée ; sinon, il est supprimé.

Remarque sur les mises en garde

Bien que l'approche ci-dessus supprime efficacement les colonnes en double en fonction des valeurs, il est crucial d'envisager des cas d'utilisation spécifiques. Assurez-vous que cette méthode correspond à vos données et au résultat souhaité, car il peut y avoir des situations dans lesquelles elle peut ne pas fournir le résultat escompté.

En utilisant ces approches, vous pouvez facilement supprimer les colonnes en double de votre cadre de données, garantissant ainsi la cohérence des données. et améliorer l'efficacité.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

pandas if for Lambda function this column

Déclaration：

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article précédent：Comment cartographier efficacement les nombres premiers dans une plage ?Article suivant：Comment cartographier efficacement les nombres premiers dans une plage ?

Articles Liés

Voir plus