Maison >développement back-end >Tutoriel Python >Comment puis-je filtrer un DataFrame Pandas en fonction des correspondances de sous-chaînes ?

Comment puis-je filtrer un DataFrame Pandas en fonction des correspondances de sous-chaînes ?

Susan Sarandon
Susan Sarandonoriginal
2024-12-21 01:29:18167parcourir

How Can I Filter a Pandas DataFrame Based on Substring Matches?

Filtrer un DataFrame Pandas par critères de sous-chaîne

Supposons que vous ayez un DataFrame avec une colonne contenant des valeurs de chaîne. Vous pourriez être amené à sélectionner des lignes en fonction de correspondances de chaînes partielles, comme si vous utilisiez l'idiome re.search(pattern, cell_in_question) dans les expressions régulières. Même si vous connaissez la syntaxe df[df['A'] == "hello world"], trouver un moyen d'y parvenir pour les correspondances de chaînes partielles, telles que "hello", peut s'avérer difficile.

La solution réside dans l'utilisation de méthodes de chaînes vectorisées, en particulier Series.str. En utilisant cette approche, vous pouvez effectuer l'opération suivante :

df[df['A'].str.contains("hello")]

Cette ligne de code renverra le sous-ensemble de lignes du DataFrame qui contiennent la sous-chaîne « bonjour » dans la colonne « A ». Il est important de noter que cette fonctionnalité est disponible dans la version 0.8.1 de Pandas et les versions ultérieures.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn