Maison >développement back-end >Tutoriel Python >Compréhension approfondie des techniques de suppression des données de lignes dans les pandas

Compréhension approfondie des techniques de suppression des données de lignes dans les pandas

WBOY
WBOYoriginal
2024-01-09 11:21:55939parcourir

Compréhension approfondie des techniques de suppression des données de lignes dans les pandas

Compétences en traitement de données : Explication détaillée de la façon de supprimer des lignes dans les pandas

En traitement de données, il est souvent nécessaire de supprimer certaines lignes de données dans le DataFrame. Pandas est une puissante bibliothèque de traitement de données qui fournit diverses méthodes pour implémenter des opérations de suppression de données de ligne. Cet article présentera en détail plusieurs méthodes courantes de suppression de lignes dans les pandas et fournira des exemples de code spécifiques.

  1. Utilisez la méthode drop
    L'objet DataFrame de pandas fournit la méthode drop, qui peut supprimer des lignes en spécifiant l'index de la ligne ou l'étiquette de la ligne. Voici un exemple simple :
import pandas as pd

data = {'Name': ['Tom', 'Nick', 'John', 'David'],
        'Age': [20, 25, 30, 35],
        'Gender': ['M', 'M', 'M', 'M']}

df = pd.DataFrame(data)

# 删除索引为2的行数据
df = df.drop(2)

print(df)

Le résultat est le suivant :

   Name  Age Gender
0   Tom   20      M
1  Nick   25      M
3  David  35      M

Comme vous pouvez le voir, la méthode drop renvoie un nouveau DataFrame et supprime les lignes spécifiées dans le résultat.

  1. Utilisation de l'indexation booléenne
    Dans certains cas, nous devrons peut-être supprimer des lignes en fonction d'une condition. L'indexation booléenne de Pandas fournit un moyen simple de procéder. Voici un exemple :
import pandas as pd

data = {'Name': ['Tom', 'Nick', 'John', 'David'],
        'Age': [20, 25, 30, 35],
        'Gender': ['M', 'M', 'M', 'M']}

df = pd.DataFrame(data)

# 删除所有年龄小于30的行数据
df = df[df['Age'] >= 30]

print(df)

Le résultat est le suivant :

   Name  Age Gender
2  John  30      M
3  David 35      M

Comme vous pouvez le voir, en définissant l'index booléen sur True ou False, nous pouvons filtrer les données de ligne qui doivent être conservées.

  1. Utiliser l'opération de découpage
    Si vous souhaitez supprimer plusieurs lignes de données consécutives, vous pouvez utiliser l'opération de découpage pour y parvenir. Voici un exemple :
import pandas as pd

data = {'Name': ['Tom', 'Nick', 'John', 'David'],
        'Age': [20, 25, 30, 35],
        'Gender': ['M', 'M', 'M', 'M']}

df = pd.DataFrame(data)

# 删除索引为1到2的行数据
df = df.drop(df.index[1:3])

print(df)

Le résultat est le suivant :

   Name  Age Gender
0   Tom   20      M
3  David 35      M

Comme vous pouvez le voir, en définissant la plage d'index de l'opération de découpage, nous pouvons supprimer plusieurs lignes de données consécutives.

  1. Utilisez les méthodes set_index et reset_index
    Si l'index de ligne du DataFrame est de type numérique et qu'il manque des lignes, vous pouvez utiliser les méthodes set_index et reset_index pour supprimer les lignes manquantes. Voici un exemple :
import pandas as pd

data = {'Name': ['Tom', 'Nick', 'John', 'David'],
        'Age': [20, 25, 30, 35],
        'Gender': ['M', 'M', 'M', 'M']}

df = pd.DataFrame(data)

# 设置第三行的索引为缺失
df.set_index(pd.Index(['0', '1', '3']), inplace=True)

# 重置索引并删除缺失的行
df.reset_index(drop=True, inplace=True)

print(df)

Le résultat est le suivant :

   Name  Age Gender
0   Tom   20      M
1  Nick  25      M
2  David 35      M

Comme vous pouvez le voir, en définissant l'index sur la ligne manquante et en utilisant la méthode reset_index pour réinitialiser l'index et supprimer la ligne manquante, nous pouvons supprimer une ligne spécifique.

Pour résumer, voici plusieurs méthodes courantes pour supprimer les données de ligne dans pandas DataFrame. En fonction des différents besoins, nous pouvons choisir une méthode appropriée pour réaliser la tâche de traitement des données. Dans les applications pratiques, des méthodes appropriées peuvent être sélectionnées pour supprimer les données de ligne en fonction de circonstances spécifiques afin d'améliorer l'efficacité et la précision du traitement des données.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn