Maison >développement back-end >Tutoriel Python >Guide pratique Pandas : Conseils pour supprimer rapidement les données des lignes

Guide pratique Pandas : Conseils pour supprimer rapidement les données des lignes

王林
王林original
2024-01-10 09:09:42712parcourir

Guide pratique Pandas : Conseils pour supprimer rapidement les données des lignes

Guide pratique Pandas : Conseils pour supprimer rapidement des lignes de données

Présentation :
Pandas est une bibliothèque d'analyse de données couramment utilisée en Python, avec de puissantes fonctions de traitement et de manipulation de données. Lors du traitement des données, il est souvent nécessaire de supprimer les données de ligne inutiles. Cet article présentera quelques techniques de suppression de données de ligne à l'aide de pandas et fournira des exemples de code spécifiques.

1. Supprimer les données de ligne dans des conditions spécifiques

  1. Supprimer les lignes avec une valeur spécifique :
    Dans les pandas, vous pouvez utiliser la méthode drop de DataFrame pour supprimer les lignes avec une valeur spécifique. Tout d'abord, nous devons créer un exemple d'ensemble de données :
import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 35, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}

df = pd.DataFrame(data)

Maintenant, nous voulons supprimer les lignes avec Gender as Male, vous pouvez utiliser le code suivant :

df = df.drop(df[df['Gender'] == 'Male'].index)

Après l'exécution, les données de ligne avec Gender as Male seront supprimées. du df.
Analyse du code :

  • df['Gender'] == 'Male' est une instruction de jugement conditionnel qui renvoie un objet Boolean Series, représentant la ligne avec la valeur Male dans la colonne Gender ; df['Gender'] == 'Male' 是一个条件判断语句,返回一个布尔类型的Series对象,表示Gender列中值为Male的行;
  • df[df['Gender'] == 'Male'].index 返回索引,即Gender为'Male'的行所在的索引位置;
  • df.drop() 方法可以根据索引删除行。
  1. 删除空值行:
    有时候需要删除包含空值的行数据,例如:
import pandas as pd
import numpy as np

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, np.nan, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}
df = pd.DataFrame(data)

我们可以使用dropna()方法删除包含空值的行:

df = df.dropna()

运行后,df将删除包含空值的行数据。

  1. 删除重复行:
    若数据集中包含重复的行,我们可以使用drop_duplicates()方法删除重复行数据:
import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Bob', 'David'],
        'Age': [25, 30, 30, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}
df = pd.DataFrame(data)

现在我们可以使用以下代码删除重复行:

df = df.drop_duplicates()

二、根据行索引删除行
有时我们需要根据行索引进行删除,可以使用drop()df[df['Gender'] == 'Male'].index Renvoie l'index, c'est-à-dire la position d'index de la ligne dont le sexe est 'Male' ; La méthode .drop() peut supprimer des lignes en fonction de l'index.

    Supprimer les lignes avec des valeurs nulles :

    Parfois, il est nécessaire de supprimer les données de ligne contenant des valeurs nulles, par exemple :

    import pandas as pd
    
    data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
            'Age': [25, 30, 35, 40],
            'Gender': ['Female', 'Male', 'Male', 'Male']}
    
    df = pd.DataFrame(data)

    Nous pouvons utiliser dropna() Méthode pour supprimer les lignes contenant des valeurs nulles : <br><pre class='brush:python;toolbar:false;'>df = df.drop(2)</pre>

    Après l'exécution, df supprimera les données de ligne contenant des valeurs nulles.

      Supprimer les lignes en double :

      Si l'ensemble de données contient des lignes en double, nous pouvons utiliser la méthode drop_duplicates() pour supprimer les données de lignes en double :

      import pandas as pd
      
      data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
              'Age': [25, 30, 35, 40],
              'Gender': ['Female', 'Male', 'Male', 'Male']}
      
      df = pd.DataFrame(data)

      Maintenant, nous peut utiliser Le code suivant supprime les lignes en double :

      df = df.drop([1, 2])

      2. Supprimer les lignes en fonction de l'index de ligne

      Parfois, nous devons supprimer en fonction de l'index de ligne. Vous pouvez utiliser la méthode drop() pour supprimer les données de ligne. basé sur l'indice. 🎜
      df = df.drop(df.index[1:4])
      🎜 Supposons que nous voulions supprimer la ligne avec l'index 2, nous pouvons utiliser le code suivant : 🎜rrreee🎜Après l'exécution, la ligne avec l'index 2 est supprimée. 🎜🎜3. Supprimer plusieurs lignes🎜 Parfois, vous devez supprimer plusieurs lignes, ce qui peut être réalisé en transmettant une liste indexée ou en utilisant le découpage. 🎜rrreee🎜Exemple 1 : Supprimer les lignes avec les index 1 et 2🎜rrreee🎜Exemple 2 : Supprimer les lignes avec les index 1 à 3🎜rrreee🎜Les deux méthodes ci-dessus peuvent supprimer rapidement plusieurs lignes. 🎜🎜Conclusion : 🎜Cet article présente les techniques de suppression de données de ligne à l'aide de pandas et fournit des exemples de code spécifiques. Lors du traitement des données, l'utilisation de ces techniques peut nous aider à supprimer rapidement et efficacement les lignes de données inutiles. On espère que les lecteurs pourront l'utiliser de manière flexible dans des applications pratiques afin d'accélérer la vitesse et la précision du traitement des données. 🎜

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn