Maison >développement back-end >Tutoriel Python >Comment extraire des nombres de chaînes dans Pandas à l'aide de str.extract() ?

Comment extraire des nombres de chaînes dans Pandas à l'aide de str.extract() ?

Mary-Kate Olsen
Mary-Kate Olsenoriginal
2024-10-24 13:06:31554parcourir

How to Extract Numbers from Strings in Pandas Using str.extract()?

Extraire des nombres à partir de chaînes dans Pandas

Pour extraire des nombres à partir de chaînes dans un bloc de données Pandas, envisagez d'utiliser la méthode str.extract. Cette méthode permet d'utiliser des expressions régulières pour extraire des modèles spécifiques des valeurs de chaîne d'un bloc de données.

Dans l'exemple fourni, le bloc de données df contient une colonne « A » avec des types de données mixtes, y compris des chaînes contenant des nombres. Pour extraire uniquement les nombres, un groupe de capture regex peut être utilisé :

<code class="python">df.A.str.extract('(\d+)')</code>

Le modèle d'expression régulière (d ) spécifie un groupe de capture qui correspond à un ou plusieurs chiffres (d). Cela isolera les nombres dans chaque chaîne.

Le résultat est une nouvelle colonne de bloc de données contenant les nombres extraits :

    A
0   1
1   NaN
2   10
3   100
4   0

Notez que cette méthode ne fonctionnera que pour les nombres entiers et non pour les nombres flottants. . Pour les modèles plus complexes ou les cas où les nombres sont séparés par des chiffres, une syntaxe d'expression régulière supplémentaire peut être requise.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn