Maison >développement back-end >Tutoriel Python >Maîtrisez rapidement les points de connaissances clés du filtrage des données Pandas

Maîtrisez rapidement les points de connaissances clés du filtrage des données Pandas

WBOY
WBOYoriginal
2024-01-24 08:07:061263parcourir

Maîtrisez rapidement les points de connaissances clés du filtrage des données Pandas

Maîtrisez rapidement les points de connaissance clés du filtrage des données Pandas, des exemples de code spécifiques sont nécessaires

Présentation :
Pandas est une puissante bibliothèque d'analyse de données qui fournit des fonctions et des outils riches pour traiter et analyser les données. Parmi elles, le filtrage des données est l'une des opérations importantes de Pandas, qui peut nous aider à extraire des données les informations qui nous intéressent. Cet article présentera les points de connaissance clés du filtrage des données dans Pandas et fournira des exemples de code spécifiques pour aider les lecteurs à maîtriser rapidement cette compétence importante.

  1. Utilisez l'index booléen pour filtrer les données
    L'index booléen est une méthode de filtrage basée sur des expressions conditionnelles, qui peut filtrer les données en fonction d'une certaine condition. Voici un exemple de code qui utilise l'index booléen pour filtrer les données :
import pandas as pd

# 创建一个示例数据
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 30, 35, 40],
        'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)

# 筛选age大于30的数据
age_filter = df['age'] > 30
filtered_data = df[age_filter]
print(filtered_data)

Résultats de sortie :

      name  age gender
2  Charlie   35      M
3    David   40      M
  1. Utilisez la méthode isin() pour filtrer les données
    La méthode isin() peut être utilisée pour vérifier si la valeur d'une colonne est dans a donné Dans la liste, une série de valeurs booléennes sera renvoyée, indiquant si chaque valeur remplit les conditions. Voici un exemple de code qui utilise la méthode isin() pour filtrer les données :
import pandas as pd

# 创建一个示例数据
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 30, 35, 40],
        'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)

# 筛选name在给定列表中的数据
filter_names = ['Alice', 'Charlie']
filtered_data = df[df['name'].isin(filter_names)]
print(filtered_data)

Résultats de sortie :

      name  age gender
0    Alice   25      F
2  Charlie   35      M
  1. Utilisez des expressions conditionnelles pour filtrer les données
    En plus des deux méthodes couramment utilisées ci-dessus, Pandas fournit également des méthodes plus flexibles. expressions conditionnelles Comment filtrer les données. Vous pouvez utiliser des opérateurs de comparaison (tels que >,
import pandas as pd

# 创建一个示例数据
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 30, 35, 40],
        'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)

# 筛选年龄大于30且性别为男性的数据
filtered_data = df[(df['age'] > 30) & (df['gender'] == 'M')]
print(filtered_data)

Résultats de sortie :

      name  age gender
2  Charlie   35      M
3    David   40      M
  1. Utilisez la méthode query() pour filtrer les données
    La méthode query() peut utiliser une syntaxe de type SQL pour filtrer les données, ce qui peut être plus Filtrez les données de manière intuitive et concise. Voici un exemple de code qui utilise la méthode query() pour filtrer les données :
import pandas as pd

# 创建一个示例数据
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 30, 35, 40],
        'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)

# 使用query()方法筛选年龄大于30且性别为男性的数据
filtered_data = df.query('age > 30 and gender == "M"')
print(filtered_data)

Résultats de sortie :

      name  age gender
2  Charlie   35      M
3    David   40      M

Résumé :
Cet article présente les points de connaissance clés du filtrage des données dans Pandas et fournit des exemples de code spécifiques. En maîtrisant ces points de connaissances, les lecteurs peuvent extraire plus efficacement les informations requises à partir de grandes quantités de données. J'espère que cet article pourra aider les lecteurs à maîtriser rapidement les compétences de filtrage des données Pandas et à améliorer leurs capacités d'analyse des données.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn