Maison >développement back-end >Tutoriel Python >Compréhension approfondie des techniques de suppression des données de lignes dans les pandas
Compétences en traitement de données : Explication détaillée de la façon de supprimer des lignes dans les pandas
En traitement de données, il est souvent nécessaire de supprimer certaines lignes de données dans le DataFrame. Pandas est une puissante bibliothèque de traitement de données qui fournit diverses méthodes pour implémenter des opérations de suppression de données de ligne. Cet article présentera en détail plusieurs méthodes courantes de suppression de lignes dans les pandas et fournira des exemples de code spécifiques.
import pandas as pd data = {'Name': ['Tom', 'Nick', 'John', 'David'], 'Age': [20, 25, 30, 35], 'Gender': ['M', 'M', 'M', 'M']} df = pd.DataFrame(data) # 删除索引为2的行数据 df = df.drop(2) print(df)
Le résultat est le suivant :
Name Age Gender 0 Tom 20 M 1 Nick 25 M 3 David 35 M
Comme vous pouvez le voir, la méthode drop renvoie un nouveau DataFrame et supprime les lignes spécifiées dans le résultat.
import pandas as pd data = {'Name': ['Tom', 'Nick', 'John', 'David'], 'Age': [20, 25, 30, 35], 'Gender': ['M', 'M', 'M', 'M']} df = pd.DataFrame(data) # 删除所有年龄小于30的行数据 df = df[df['Age'] >= 30] print(df)
Le résultat est le suivant :
Name Age Gender 2 John 30 M 3 David 35 M
Comme vous pouvez le voir, en définissant l'index booléen sur True ou False, nous pouvons filtrer les données de ligne qui doivent être conservées.
import pandas as pd data = {'Name': ['Tom', 'Nick', 'John', 'David'], 'Age': [20, 25, 30, 35], 'Gender': ['M', 'M', 'M', 'M']} df = pd.DataFrame(data) # 删除索引为1到2的行数据 df = df.drop(df.index[1:3]) print(df)
Le résultat est le suivant :
Name Age Gender 0 Tom 20 M 3 David 35 M
Comme vous pouvez le voir, en définissant la plage d'index de l'opération de découpage, nous pouvons supprimer plusieurs lignes de données consécutives.
import pandas as pd data = {'Name': ['Tom', 'Nick', 'John', 'David'], 'Age': [20, 25, 30, 35], 'Gender': ['M', 'M', 'M', 'M']} df = pd.DataFrame(data) # 设置第三行的索引为缺失 df.set_index(pd.Index(['0', '1', '3']), inplace=True) # 重置索引并删除缺失的行 df.reset_index(drop=True, inplace=True) print(df)
Le résultat est le suivant :
Name Age Gender 0 Tom 20 M 1 Nick 25 M 2 David 35 M
Comme vous pouvez le voir, en définissant l'index sur la ligne manquante et en utilisant la méthode reset_index pour réinitialiser l'index et supprimer la ligne manquante, nous pouvons supprimer une ligne spécifique.
Pour résumer, voici plusieurs méthodes courantes pour supprimer les données de ligne dans pandas DataFrame. En fonction des différents besoins, nous pouvons choisir une méthode appropriée pour réaliser la tâche de traitement des données. Dans les applications pratiques, des méthodes appropriées peuvent être sélectionnées pour supprimer les données de ligne en fonction de circonstances spécifiques afin d'améliorer l'efficacité et la précision du traitement des données.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!