Maison  >  Article  >  développement back-end  >  Comment supprimer les caractères indésirables des chaînes dans une colonne Pandas DataFrame ?

Comment supprimer les caractères indésirables des chaînes dans une colonne Pandas DataFrame ?

Susan Sarandon
Susan Sarandonoriginal
2024-11-08 09:17:02690parcourir

How to Remove Unwanted Characters from Strings in a Pandas DataFrame Column?

Suppression des caractères indésirables des chaînes dans une colonne de données

Dans cette question de programmation, la tâche consiste à supprimer efficacement les caractères indésirables des chaînes dans un colonne spécifique d'un DataFrame pandas. Les données contiennent une colonne « résultat » avec des chaînes comportant des signes préfixés et des lettres suffixées. L'objectif est de couper ces chaînes pour conserver uniquement les valeurs numériques souhaitées.

Les tentatives de solutions utilisant '.str.lstrip(' -')' et '.str.rstrip('aAbBcC')' ont entraîné des erreurs. en raison d'arguments incorrects transmis.

Pour résoudre ce problème, la solution exploite la fonction '.map()' pour appliquer une fonction lambda à chaque élément du colonne « résultat ». Voici le code :

data['result'] = data['result'].map(lambda x: x.lstrip('+-').rstrip('aAbBcC'))

Ce code supprime les caractères indésirables de chaque chaîne de la colonne « résultat » et attribue les valeurs modifiées à la colonne.

Explication :

  • La fonction '.map()' parcourt chaque élément de la colonne 'result' et applique le fonction lambda spécifiée pour chaque élément.
  • La fonction lambda 'x' accepte un seul argument (une chaîne) et supprime les caractères de début ' ' ou '-' en utilisant '.lstrip(' -')'.
  • Par la suite, il supprime les caractères « a », « A », « b », « B » ou « c » de fin en utilisant '.rstrip('aAbBcC')'.
  • La valeur modifiée, qui est maintenant une chaîne numérique tronquée, est réaffectée à la colonne « résultat », remplaçant ainsi la chaîne d'origine.

En utilisant la fonction '.map()' et l'expression lambda, ce code supprime efficacement les caractères indésirables des chaînes de la colonne DataFrame, garantissant que le nombre numérique souhaité les valeurs sont conservées.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn