Maison  >  Article  >  développement back-end  >  Comment supprimer les caractères indésirables des colonnes de chaînes dans un DataFrame ?

Comment supprimer les caractères indésirables des colonnes de chaînes dans un DataFrame ?

Susan Sarandon
Susan Sarandonoriginal
2024-11-06 17:53:02820parcourir

How to Remove Unwanted Characters from String Columns in a DataFrame?

Élimination des caractères indésirables des chaînes dans les colonnes DataFrame

Lorsque vous traitez des ensembles de données contenant des données de chaîne, il est souvent nécessaire d'en extraire des informations significatives. cordes. Cependant, des caractères ou un formatage indésirables peuvent masquer les données souhaitées. Dans ce scénario, l'objectif est de supprimer efficacement ces parties indésirables.

Supposons que nous ayons une colonne DataFrame avec les données suivantes :

time result
09:00 52A
10:00 62B
11:00 44a
12:00 30b
13:00 -110a

Notre objectif est de couper les données pour supprimer les ' ' ou le préfixe '-' et le suffixe 'a' ou 'b'. Le résultat souhaité est :

time result
09:00 52
10:00 62
11:00 44
12:00 30
13:00 110

Pour y parvenir, nous utilisons la fonction lambda dans la méthode map. L'extrait de code suivant accomplit la tâche :

data['result'] = data['result'].map(lambda x: x.lstrip('+-').rstrip('aAbBcC'))

La fonction lstrip supprime tous les caractères de début ' ' ou '-', tandis que la fonction rstrip supprime tous les caractères de fin 'a', 'A', 'b', Caractères « B » ou « c ». La sortie est un DataFrame avec les données découpées souhaitées.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn