Maison >développement back-end >Tutoriel Python >Comment filtrer les données dans les pandas

Comment filtrer les données dans les pandas

百草
百草original
2023-11-22 10:36:262008parcourir

Méthodes de filtrage des données Pandas : 1. Importer la bibliothèque Pandas ; 2. Lire les données ; 3. Filtrer les données ; 5. Regrouper et agréger les données, etc. Introduction détaillée : 1. Importez la bibliothèque Pandas. Tout d'abord, assurez-vous que la bibliothèque Pandas est installée. Si elle n'est pas installée, vous pouvez utiliser la commande "pip install pandas" pour l'installer, puis vous pouvez utiliser la commande "import pandas as". pd" pour importer la bibliothèque Pandas ; 2. Lire les données, en utilisant la bibliothèque Pandas et plus encore.

Comment filtrer les données dans les pandas

Le système d'exploitation de ce tutoriel : système Windows 10, ordinateur DELL G3.

Pandas est une bibliothèque d'analyse de données Python populaire qui fournit de nombreuses fonctionnalités puissantes qui vous permettent de filtrer, traiter et analyser facilement les données. Voici quelques façons courantes d'utiliser Pandas pour filtrer les données :

1. Importez la bibliothèque Pandas

Tout d'abord, assurez-vous que la bibliothèque Pandas est installée. S'il n'est pas installé, vous pouvez utiliser la commande suivante pour l'installer :

pip install pandas

Ensuite, importez la bibliothèque Pandas :

import pandas as pd

2. Lire les données

Utilisez la fonction read_csv() de la bibliothèque Pandas pour lire le fichier CSV , et la fonction read_excel() pour lire les fichiers Excel, etc. Par exemple, lisez un fichier CSV nommé data.csv :

df = pd.read_csv('data.csv')

3. Filtrer les données

Pandas propose diverses méthodes pour filtrer les données. Voici plusieurs méthodes courantes :

(1) Filtrage basé sur des conditions

Utilisez les attributs loc et iloc et les opérateurs logiques (tels que &, |, ~, etc.) pour filtrer les données. Par exemple, pour filtrer les données dont l'âge est supérieur ou égal à 18 ans et dont le sexe est féminin :

df.loc[(df['age'] >= 18) & (df['gender'] == 'female')]

(2) Filtrage basé sur les balises

Utilisez l'attribut loc pour filtrer les données pour des balises spécifiques. Par exemple, filtrez les données avec le nom de famille « Zhang » :

df.loc[df['last_name'] == '张']

(3) Filtrer par plage

Utilisez l'attribut loc pour filtrer les données dans une plage spécifique. Par exemple, filtrez les données entre 18 et 30 ans :

df.loc[(df[&#39;age&#39;] >= 18) & (df[&#39;age&#39;] <= 30)]

(4) Filtrer selon plusieurs conditions

Utilisez la méthode de requête pour filtrer les données qui répondent à plusieurs conditions. Par exemple, pour filtrer les données dont l'âge est supérieur ou égal à 18 ans et dont le sexe est féminin :

df.query(&#39;age >= 18 & gender == "female"&#39;)

4 Trier les données

Utilisez la méthode sort_values() pour trier les données. Par exemple, triez par âge par ordre croissant :

df.sort_values(&#39;age&#39;, ascending=True)

5. Regroupez et agrégez les données

Utilisez la méthode groupby() pour regrouper les données et utilisez des fonctions d'agrégation (telles que sum(), moyenne(), count(). , etc.) pour regrouper chaque groupe Effectuer des calculs. Par exemple, calculez l'âge moyen de chaque groupe de genre :

df.groupby(&#39;gender&#39;).mean()[&#39;age&#39;]

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn