Maison >développement back-end >Tutoriel Python >Comment supprimer efficacement les caractères indésirables des chaînes dans une colonne DataFrame ?

Comment supprimer efficacement les caractères indésirables des chaînes dans une colonne DataFrame ?

Patricia Arquette
Patricia Arquetteoriginal
2024-11-06 19:39:02799parcourir

How to Efficiently Remove Unwanted Characters from Strings in a DataFrame Column?

Suppression des parties indésirables des chaînes dans une colonne DataFrame

Vous disposez d'une colonne DataFrame contenant des chaînes avec des caractères indésirables. Vous souhaitez supprimer ces caractères efficacement pour extraire les données pertinentes.

La solution réside dans l'utilisation de la méthode map de Python pour appliquer une fonction personnalisée à chaque chaîne de la colonne :

data['result' ] = data['result'].map(lambda x: x.lstrip(' -').rstrip('aAbBcC'))

Cette fonction lambda prend une chaîne x en entrée et effectue deux opérations :

  • x.lstrip(' -') supprime tous les caractères ' ' ou '-'.
  • x.rstrip('aAbBcC' ) supprime tous les caractères « a », « b » ou « c » minuscules ou majuscules de fin.

Le résultat est une colonne modifiée dans laquelle les caractères indésirables ont été supprimés. Vous pouvez désormais accéder à ces chaînes nettoyées en tant que data['result'].

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn