Maison > Article > développement back-end > Comment supprimer efficacement les caractères indésirables d’une colonne de chaîne dans un DataFrame ?
Manipulation efficace des chaînes dans les DataFrames
La manipulation des chaînes dans un DataFrame est une tâche courante dans l'analyse des données. Dans ce cas, nous cherchons à supprimer les caractères indésirables d'une colonne contenant des chaînes.
Pour y parvenir, nous pouvons utiliser l'accesseur .str. Cependant, comme vous l'avez découvert, l'application directe de .str.lstrip(' -').rstrip('aAbBcC') entraîne une erreur. En effet, les méthodes .str attendent une seule fonction comme argument.
Pour résoudre ce problème, nous pouvons utiliser la fonction .map pour appliquer la fonction lambda suivante à chaque élément de la colonne :
lambda x: x.lstrip('+-').rstrip('aAbBcC')
Cette fonction supprime les caractères de début « » ou « - » et les caractères de fin « a », « A », « b », « B » ou « c » de chaque chaîne. En appliquant cette fonction à la colonne de résultats, nous obtenons les valeurs tronquées souhaitées.
L'extrait de code suivant montre la solution :
data['result'] = data['result'].map(lambda x: x.lstrip('+-').rstrip('aAbBcC'))
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!