Maison >développement back-end >Tutoriel Python >Comment puis-je trouver des correspondances de chaînes partielles dans un DataFrame Pandas ?

Comment puis-je trouver des correspondances de chaînes partielles dans un DataFrame Pandas ?

Barbara Streisand
Barbara Streisandoriginal
2024-12-16 06:18:10242parcourir

How Can I Find Partial String Matches in a Pandas DataFrame?

Recherche de correspondances de chaînes partielles dans Pandas DataFrame

Filtrer un pandas DataFrame en fonction de critères de chaîne partielle est souvent une nécessité lorsqu'il s'agit de données texte. Cet article montre comment effectuer cette opération à l'aide de la puissante méthode Series.str.

Considérez un DataFrame avec une colonne de valeurs de chaîne. Pour filtrer les lignes en fonction des correspondances de chaînes partielles, utilisez la syntaxe suivante :

df[df['column_name'].str.contains("partial_string")]

La méthode str.contains() prend un modèle d'expression régulière et renvoie un DataFrame booléen indiquant si chaque cellule de la colonne spécifiée satisfait à la pattern.

Par exemple, pour rechercher toutes les lignes du DataFrame où la colonne de nom contient la sous-chaîne "John", utilisez ce qui suit code :

df[df['name'].str.contains("John")]

Cette méthode est compatible avec les versions pandas 0.8.1 et ultérieures, offrant un moyen efficace d'effectuer des correspondances de chaînes partielles dans vos opérations DataFrame.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn