Maison >développement back-end >Tutoriel Python >Comment supprimer des lignes spécifiques d'une trame de données Pandas ?

Comment supprimer des lignes spécifiques d'une trame de données Pandas ?

Barbara Streisand
Barbara Streisandoriginal
2024-11-01 11:59:29963parcourir

How to Drop Specific Rows from a Pandas Dataframe?

Suppression de lignes spécifiques d'un dataframe Pandas

Lorsque vous travaillez avec un dataframe Pandas, il devient souvent nécessaire de supprimer certaines lignes en fonction de critères spécifiques . Une exigence courante consiste à supprimer les lignes qui correspondent à une liste de nombres séquentiels. Cet article aborde ce problème et présente une solution complète.

Dans l'exemple fourni, nous avons un dataframe appelé « df » avec les données suivantes :

                  sales  discount  net_sales    cogs
STK_ID RPT_Date                                     
600141 20060331   2.709       NaN      2.709   2.245
       20060630   6.590       NaN      6.590   5.291
       20060930  10.103       NaN     10.103   7.981
       20061231  15.915       NaN     15.915  12.686
       20070331   3.196       NaN      3.196   2.710
       20070630   7.907       NaN      7.907   6.459

Supposons que nous voulions supprimer des lignes 1, 2 et 4 de cette trame de données. Pour y parvenir, nous pouvons utiliser la méthode 'DataFrame.drop'. Cette méthode prend un objet « Série » comme argument, qui contient les étiquettes d'index des lignes que nous souhaitons supprimer.

L'extrait de code suivant illustre comment supprimer les lignes 1, 2 et 4 de notre cadre de données :

drop_list = [1, 2, 4]
df.drop(index=drop_list, inplace=True)

Ici, nous créons une liste appelée 'drop_list' contenant les étiquettes d'index des lignes à supprimer. Nous transmettons ensuite cette liste à la méthode 'DataFrame.drop', en spécifiant le paramètre 'index' pour indiquer que nous souhaitons supprimer des lignes. Enfin, l'argument 'inplace=True' garantit que le dataframe est modifié sur place, sans qu'il soit nécessaire de l'attribuer à une nouvelle variable.

Après avoir exécuté le code ci-dessus, notre dataframe sera mis à jour comme suit :

                  sales  discount  net_sales    cogs
STK_ID RPT_Date                                     
600141 20060331   2.709       NaN      2.709   2.245
       20061231  15.915       NaN     15.915  12.686
       20070630   7.907       NaN      7.907   6.459

Comme vous pouvez le voir, les lignes 1, 2 et 4 ont été supprimées avec succès du dataframe. Cette méthode est très efficace pour supprimer des lignes spécifiques en fonction d'étiquettes d'index ou d'autres critères et peut être facilement personnalisée pour répondre à vos besoins spécifiques en matière de manipulation de données.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn