Maison >développement back-end >Tutoriel Python >Comment filtrer les lignes dans les DataFrames Pandas avec le chaînage d'opérateurs ?
Filtrage des lignes dans les DataFrames Pandas avec le chaînage d'opérateurs
La flexibilité des opérations Pandas permet un chaînage pratique pour accomplir des tâches de manipulation de données. Cependant, le filtrage des lignes nécessite traditionnellement une indexation manuelle par parenthèses, ce qui peut s'avérer fastidieux.
Indexation booléenne chaînée
Le moyen le plus simple de filtrer les lignes à l'aide du chaînage d'opérateurs consiste à créer un masque booléen et indexer le DataFrame avec celui-ci :
<code class="python">df_filtered = df[df['column'] == value]</code>
Le masque booléen vérifie la valeur de chaque ligne pour la colonne spécifiée et renvoie True pour les lignes correspondantes.
Chaînage des méthodes de masque personnalisé
Vous pouvez également étendre la classe DataFrame avec une méthode de masquage personnalisée :
<code class="python">def mask(df, key, value): return df[df[key] == value] pandas.DataFrame.mask = mask</code>
Cette méthode prend un DataFrame, un nom de colonne et une valeur comme paramètres et masque sélectivement les lignes en fonction sur le critère spécifié.
<code class="python">df_filtered = df.mask('column', value)</code>
Chaînage de plusieurs masques
Le filtrage des opérateurs chaînés permet des critères complexes en combinant plusieurs masques :
<code class="python">df_filtered = df[ (df['column1'] == value1) & (df['column2'] == value2) & ... ]</code>
En résumé, pandas propose deux méthodes principales pour le filtrage des lignes chaînées :
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!