Maison > Article > développement back-end > Comment filtrer les données dans les pandas
Méthodes de filtrage des données Pandas : 1. Importer la bibliothèque Pandas ; 2. Lire les données ; 3. Filtrer les données ; 5. Regrouper et agréger les données, etc. Introduction détaillée : 1. Importez la bibliothèque Pandas. Tout d'abord, assurez-vous que la bibliothèque Pandas est installée. Si elle n'est pas installée, vous pouvez utiliser la commande "pip install pandas" pour l'installer, puis vous pouvez utiliser la commande "import pandas as". pd" pour importer la bibliothèque Pandas ; 2. Lire les données, en utilisant la bibliothèque Pandas et plus encore.
Le système d'exploitation de ce tutoriel : système Windows 10, ordinateur DELL G3.
Pandas est une bibliothèque d'analyse de données Python populaire qui fournit de nombreuses fonctionnalités puissantes qui vous permettent de filtrer, traiter et analyser facilement les données. Voici quelques façons courantes d'utiliser Pandas pour filtrer les données :
1. Importez la bibliothèque Pandas
Tout d'abord, assurez-vous que la bibliothèque Pandas est installée. S'il n'est pas installé, vous pouvez utiliser la commande suivante pour l'installer :
pip install pandas
Ensuite, importez la bibliothèque Pandas :
import pandas as pd
2. Lire les données
Utilisez la fonction read_csv() de la bibliothèque Pandas pour lire le fichier CSV , et la fonction read_excel() pour lire les fichiers Excel, etc. Par exemple, lisez un fichier CSV nommé data.csv :
df = pd.read_csv('data.csv')
3. Filtrer les données
Pandas propose diverses méthodes pour filtrer les données. Voici plusieurs méthodes courantes :
(1) Filtrage basé sur des conditions
Utilisez les attributs loc et iloc et les opérateurs logiques (tels que &, |, ~, etc.) pour filtrer les données. Par exemple, pour filtrer les données dont l'âge est supérieur ou égal à 18 ans et dont le sexe est féminin :
df.loc[(df['age'] >= 18) & (df['gender'] == 'female')]
(2) Filtrage basé sur les balises
Utilisez l'attribut loc pour filtrer les données pour des balises spécifiques. Par exemple, filtrez les données avec le nom de famille « Zhang » :
df.loc[df['last_name'] == '张']
(3) Filtrer par plage
Utilisez l'attribut loc pour filtrer les données dans une plage spécifique. Par exemple, filtrez les données entre 18 et 30 ans :
df.loc[(df['age'] >= 18) & (df['age'] <= 30)]
(4) Filtrer selon plusieurs conditions
Utilisez la méthode de requête pour filtrer les données qui répondent à plusieurs conditions. Par exemple, pour filtrer les données dont l'âge est supérieur ou égal à 18 ans et dont le sexe est féminin :
df.query('age >= 18 & gender == "female"')
4 Trier les données
Utilisez la méthode sort_values() pour trier les données. Par exemple, triez par âge par ordre croissant :
df.sort_values('age', ascending=True)
5. Regroupez et agrégez les données
Utilisez la méthode groupby() pour regrouper les données et utilisez des fonctions d'agrégation (telles que sum(), moyenne(), count(). , etc.) pour regrouper chaque groupe Effectuer des calculs. Par exemple, calculez l'âge moyen de chaque groupe de genre :
df.groupby('gender').mean()['age']
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!