Maison >développement back-end >Tutoriel Python >Comment appliquer efficacement plusieurs filtres aux DataFrames et séries Pandas ?

Comment appliquer efficacement plusieurs filtres aux DataFrames et séries Pandas ?

DDD
DDDoriginal
2024-10-20 11:58:02420parcourir

How to Efficiently Apply Multiple Filters to Pandas DataFrames and Series?

Filtrage efficace des DataFrames et séries Pandas

Le filtrage des données dans les DataFrames et séries Pandas est essentiel pour la manipulation et l'analyse des données. Pour appliquer efficacement plusieurs filtres, envisagez de tirer parti des opérateurs intégrés et de l'indexation booléenne de Pandas.

Pour un DataFrame ou une série, fournir une opération et une liste de valeurs dans un format de dictionnaire, comme indiqué dans l'exemple ci-dessous :

<code class="python">relops = {'>=': [1], '<=': [1]}

Pour appliquer ces filtres :

<code class="python">import numpy as np

def boolean_filter(x, relops):
    filters = []
    for op, vals in relops.items():
        op_func = getattr(np, op)
        for val in vals:
            filters.append(op_func(x, val))

    return x[(np.logical_and(*filters))]

## Example:

df = pandas.DataFrame({'col1': [0, 1, 2], 'col2': [10, 11, 12]})

result = boolean_filter(df['col1'], {'>=': [1]})
print(result)

## Output:
# col1
# 1       1
# 2       2
# Name: col1</code>

En utilisant l'indexation booléenne, cette méthode évite les copies inutiles et est très efficace, en particulier pour les grands ensembles de données.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn