Maison >développement back-end >Tutoriel Python >Comment supprimer efficacement les lignes DataFrame en fonction de la valeur de la colonne dans Pandas ?

Comment supprimer efficacement les lignes DataFrame en fonction de la valeur de la colonne dans Pandas ?

Linda Hamilton
Linda Hamiltonoriginal
2024-12-29 22:08:16505parcourir

How to Efficiently Delete DataFrame Rows Based on Column Value in Pandas?

Suppression efficace des lignes DataFrame en fonction de la valeur de la colonne

Dans Pandas, la suppression des lignes en fonction d'une valeur de colonne spécifique peut être réalisée de plusieurs manières. L'une des approches les plus efficaces consiste à utiliser l'indexation logique.

Considérez le DataFrame suivant :

df = pd.DataFrame({
    "daysago": [62, 83, 111, 139, 160, 204, 222, 245, 258, 275, 475, 504, 515, 542, 549, 556, 577, 589, 612, 632, 719, 733, 760, 790, 810, 934],
    "line_race": [11, 11, 9, 10, 10, 9, 8, 9, 11, 8, 5, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
    "rating": [56, 67, 66, 83, 88, 52, 66, 70, 68, 72, 65, 70, 64, 70, 70, -1, -1, -1, -1, -1, 69, -1, -1, -1, -1, -1],
    "rw": [1.000000, 1.000000, 1.000000, 0.880678, 0.793033, 0.636655, 0.581946, 0.518825, 0.486226, 0.446667, 0.164591, 0.142409, 0.134800, 0.117803, 0.113758, 0.109852, 0.098919, 0.093168, 0.083063, 0.075171, 0.048690, 0.045404, 0.039679, 0.034160, 0.030915, 0.016647],
    "wrating": [56.000000, 67.000000, 66.000000, 73.096278, 69.786942, 33.106077, 38.408408, 36.317752, 33.063381, 32.160051, 10.698423, 9.968634, 8.627219, 8.246238, 7.963072, -0.109852, -0.098919, -0.093168, -0.083063, -0.075171, 3.359623, -0.045404, -0.039679, -0.034160, -0.030915, -0.016647]
})

Pour supprimer les lignes où la colonne line_race est égale à 0, nous pouvons utiliser ce qui suit ligne de code :

df = df[df["line_race"] != 0]

Cette expression crée un nouveau DataFrame qui inclut uniquement les lignes où la colonne line_race n'a pas la valeur 0. En utilisant l'indexation logique, nous évitons de créer une copie des données, ce qui peut constituer une amélioration significative des performances lorsque vous travaillez avec de grands ensembles de données.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn