Maison >développement back-end >Tutoriel Python >Comment puis-je rechercher efficacement des sous-chaînes dans les colonnes Pandas DataFrame ?

Comment puis-je rechercher efficacement des sous-chaînes dans les colonnes Pandas DataFrame ?

Patricia Arquette
Patricia Arquetteoriginal
2024-12-17 20:27:15371parcourir

How Can I Efficiently Find Substrings Within Pandas DataFrame Columns?

Recherche de sous-chaînes dans un DataFrame Pandas

Lorsque vous travaillez avec des DataFrames pandas qui contiennent des colonnes de valeurs de chaîne, il devient nécessaire de filtrer les lignes en fonction des correspondances de chaînes partielles. Par exemple, isoler des lignes contenant des données liées à une entité ou à un sujet spécifique.

Pour répondre à cette exigence, pandas propose une solution puissante via son attribut Series.str. Cet attribut permet l'utilisation de méthodes de chaînes vectorisées. Par exemple :

df[df['A'].str.contains("hello")]

Cette ligne de code filtre le DataFrame df en vérifiant si les valeurs de la colonne « A » contiennent la sous-chaîne « bonjour ». Il renvoie un nouveau DataFrame contenant uniquement les lignes qui remplissent cette condition.

Cette fonctionnalité est particulièrement utile lorsqu'il s'agit de grands DataFrames, car elle offre une méthode hautement optimisée et efficace pour effectuer des opérations de correspondance de chaînes partielles.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn