Maison >développement back-end >Tutoriel Python >Comment supprimer efficacement les caractères indésirables d'une colonne de chaîne dans un DataFrame ?

Comment supprimer efficacement les caractères indésirables d'une colonne de chaîne dans un DataFrame ?

DDD
DDDoriginal
2024-11-10 16:37:02585parcourir

How to Efficiently Remove Unwanted Characters from a String Column in a DataFrame?

Manipulation efficace des chaînes dans les DataFrames

La manipulation des chaînes dans un DataFrame est une tâche courante dans l'analyse des données. Dans ce cas, nous cherchons à supprimer les caractères indésirables d'une colonne contenant des chaînes.

Pour y parvenir, nous pouvons utiliser l'accesseur .str. Cependant, comme vous l'avez découvert, l'application directe de .str.lstrip(' -').rstrip('aAbBcC') entraîne une erreur. En effet, les méthodes .str attendent une seule fonction comme argument.

Pour résoudre ce problème, nous pouvons utiliser la fonction .map pour appliquer la fonction lambda suivante à chaque élément de la colonne :

lambda x: x.lstrip('+-').rstrip('aAbBcC')

Cette fonction supprime les caractères de début « » ou « - » et les caractères de fin « a », « A », « b », « B » ou « c » de chaque chaîne. En appliquant cette fonction à la colonne de résultats, nous obtenons les valeurs tronquées souhaitées.

L'extrait de code suivant montre la solution :

data['result'] = data['result'].map(lambda x: x.lstrip('+-').rstrip('aAbBcC'))

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn