Maison >développement back-end >Tutoriel Python >Tutoriel sur la suppression de données de ligne à l'aide de pandas

Tutoriel sur la suppression de données de ligne à l'aide de pandas

WBOY
WBOYoriginal
2024-01-09 14:33:534805parcourir

Tutoriel sur la suppression de données de ligne à laide de pandas

Tutoriel pandas : Comment utiliser des pandas pour supprimer des données de ligne, des exemples de code spécifiques sont requis

Introduction :
Dans l'analyse et le traitement des données, les données doivent souvent être nettoyées et traitées, et la suppression des données de ligne inutiles ou invalides dans le L'ensemble de données est une opération courante. En Python, la bibliothèque pandas fournit de puissants outils de manipulation de données. Cet article explique comment utiliser pandas pour supprimer des données de ligne et donne des exemples de code spécifiques.

  1. Importer la bibliothèque pandas
    Avant de commencer, vous devez d'abord importer la bibliothèque pandas.

importer des pandas en tant que pd

  1. Créer des exemples de données
    Pour démontrer, créons d'abord un exemple de données contenant quelques lignes de données. Le code suivant crée un objet DataFrame nommé « data » et ajoute quelques lignes de données.

data = {'Nom' : ['Zhang San', 'Li Si', 'Wang Wu', 'Zhao Liu', 'Liu Qi'],

    '年龄': [20, 25, 30, 35, 40],
    '性别': ['男', '男', '女', '男', '女']}

df = pd.DataFrame(data)

print("Données originales :")
print(df)

Résultat de sortie :
Données originales :
Nom Âge Sexe
0 Zhang San 20 ans Homme
1 Li Si 25 ans Homme
2 Wang Wu 30 ans Femme
3 Zhao Liu 35 ans Homme
4 Liu Qi 40 Féminin

  1. Utiliser des conditions pour supprimer les données de ligne
    pandas propose diverses méthodes pour supprimer les données de ligne. La méthode la plus courante consiste à supprimer des lignes via des conditions, c'est-à-dire à supprimer uniquement les données de ligne qui remplissent certaines conditions. L'exemple de code suivant montre comment supprimer les lignes dont l'âge est supérieur ou égal à 30.

df = df[df['age']

print("Supprimer les données avec un âge supérieur ou égal à 30 :")
print(df)

Résultat de sortie :
Supprimer les données avec l'âge supérieur ou égal à 30 :
Nom Âge Sexe
0 Zhang San 20 Homme
1 Li Si 25 Homme

  1. Utilisez l'index pour supprimer les données de ligne
    En plus d'utiliser des conditions pour supprimer, vous pouvez également utiliser l'index pour supprimer des lignes dans l’ensemble de données. En spécifiant l'étiquette d'index de la ligne, les pandas peuvent facilement supprimer la ligne de données spécifiée. L'exemple de code suivant montre comment supprimer les première et dernière lignes de données.

df = df.drop([0, 4])

print("Supprimer la première et la dernière ligne de données :")
print(df)

Résultat de sortie :
Supprimer la première et la dernière ligne de données :
Nom Âge Sexe
1 Li Si 25 hommes
2 Wang Wu 30 femmes
3 Zhao Liu 35 hommes

  1. Utilisez le numéro de ligne pour supprimer les données de ligne
    En plus d'utiliser les balises d'index, vous pouvez également utiliser les numéros de ligne pour supprimer les données de ligne . Pandas fournit la méthode "iloc", qui peut supprimer les données de ligne spécifiées en définissant le numéro de ligne. L'exemple de code suivant montre comment supprimer les deuxième et troisième lignes de données.

df = df.drop(df.index[[1, 2]])

print("Supprimer les données des deuxième et troisième lignes :")
print(df)

Résultat de sortie :
Supprimer les données dans les deuxième et troisième lignes :
Nom Âge Sexe
0 Zhang San 20 Homme
3 Zhao Liu 35 Homme

  1. Modifier les données d'origine
    Dans l'exemple ci-dessus, la suppression des données de ligne est effectuée sur une copie de l'objet DataFrame, le les données originales ne sont pas modifiées. Si vous souhaitez modifier les données d'origine, vous devez ajouter un paramètre supplémentaire "inplace=True". L'exemple de code suivant montre comment supprimer les lignes qui répondent à une condition directement sur les données d'origine.

df.drop(df[df['age'] >= 30].index, inplace=True)

print("Supprimer les données ayant un âge supérieur ou égal à 30 ans directement sur les données d'origine :" )
print( df)

Résultats de sortie :
Supprimer les données dont l'âge est supérieur ou égal à 30 ans directement sur les données d'origine :
Nom Âge Sexe
0 Zhang San 20 Homme
1 Li Si 25 Homme

Conclusion :
Par en utilisant la bibliothèque pandas et l'exemple de code ci-dessus, nous pouvons facilement supprimer les données de ligne dans l'objet DataFrame. Grâce à des conditions, des étiquettes d'index ou des numéros de ligne, nous pouvons supprimer de manière sélective les lignes de données qui répondent à des conditions spécifiques. Cela nous fournit des outils et des méthodes très pratiques pour le nettoyage et le traitement des données.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn