Maison >développement back-end >Tutoriel Python >Tutoriel sur la suppression de données de ligne à l'aide de pandas
Tutoriel pandas : Comment utiliser des pandas pour supprimer des données de ligne, des exemples de code spécifiques sont requis
Introduction :
Dans l'analyse et le traitement des données, les données doivent souvent être nettoyées et traitées, et la suppression des données de ligne inutiles ou invalides dans le L'ensemble de données est une opération courante. En Python, la bibliothèque pandas fournit de puissants outils de manipulation de données. Cet article explique comment utiliser pandas pour supprimer des données de ligne et donne des exemples de code spécifiques.
importer des pandas en tant que pd
data = {'Nom' : ['Zhang San', 'Li Si', 'Wang Wu', 'Zhao Liu', 'Liu Qi'],
'年龄': [20, 25, 30, 35, 40], '性别': ['男', '男', '女', '男', '女']}
df = pd.DataFrame(data)
print("Données originales :")
print(df)
Résultat de sortie :
Données originales :
Nom Âge Sexe
0 Zhang San 20 ans Homme
1 Li Si 25 ans Homme
2 Wang Wu 30 ans Femme
3 Zhao Liu 35 ans Homme
4 Liu Qi 40 Féminin
df = df[df['age']
print("Supprimer les données avec un âge supérieur ou égal à 30 :")
print(df)
Résultat de sortie :
Supprimer les données avec l'âge supérieur ou égal à 30 :
Nom Âge Sexe
0 Zhang San 20 Homme
1 Li Si 25 Homme
df = df.drop([0, 4])
print("Supprimer la première et la dernière ligne de données :")
print(df)
Résultat de sortie :
Supprimer la première et la dernière ligne de données :
Nom Âge Sexe
1 Li Si 25 hommes
2 Wang Wu 30 femmes
3 Zhao Liu 35 hommes
df = df.drop(df.index[[1, 2]])
print("Supprimer les données des deuxième et troisième lignes :")
print(df)
Résultat de sortie :
Supprimer les données dans les deuxième et troisième lignes :
Nom Âge Sexe
0 Zhang San 20 Homme
3 Zhao Liu 35 Homme
df.drop(df[df['age'] >= 30].index, inplace=True)
print("Supprimer les données ayant un âge supérieur ou égal à 30 ans directement sur les données d'origine :" )
print( df)
Résultats de sortie :
Supprimer les données dont l'âge est supérieur ou égal à 30 ans directement sur les données d'origine :
Nom Âge Sexe
0 Zhang San 20 Homme
1 Li Si 25 Homme
Conclusion :
Par en utilisant la bibliothèque pandas et l'exemple de code ci-dessus, nous pouvons facilement supprimer les données de ligne dans l'objet DataFrame. Grâce à des conditions, des étiquettes d'index ou des numéros de ligne, nous pouvons supprimer de manière sélective les lignes de données qui répondent à des conditions spécifiques. Cela nous fournit des outils et des méthodes très pratiques pour le nettoyage et le traitement des données.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!