Maison >développement back-end >Tutoriel Python >Comment filtrer un DataFrame Pandas pour conserver uniquement les lignes avec des valeurs non NaN dans une colonne spécifique ?

Comment filtrer un DataFrame Pandas pour conserver uniquement les lignes avec des valeurs non NaN dans une colonne spécifique ?

Linda Hamilton
Linda Hamiltonoriginal
2024-12-14 17:52:16123parcourir

How to Filter a Pandas DataFrame to Keep Only Rows with Non-NaN Values in a Specific Column?

Comment isoler des valeurs non-NaN dans une colonne d'un DataFrame Pandas

Question :

Considérez un DataFrame comme ceci :

STK_ID RPT_Date <br>601166 20111231 601166 NaN NaN<br>600036 20111231 600036 NaN 12<br>600016 20111231 600016 4,3 NaN<br>601009 20111231 601009 NaN NaN<br>601939 20111231 601939 2,5 NaN<br>000001 20111231 000001 NaN NaN<br>

Objectif :

Isoler les enregistrements dont la colonne "EPS" n'est pas NaN, ce qui donne ce DataFrame :

STK_ID RPT_Date <br>600016 20111231 600016 4.3 NaN<br>601939 20111231 601939 2.5 NaN<br>

Solution :

Au lieu de supprimer des lignes, vous pouvez filtrer les DataFrame utilisant la méthode notna() pour sélectionner uniquement les lignes où la colonne "EPS" n'est pas NaN :

df = df[df['EPS'].notna()]

Cela créera un nouveau DataFrame avec le résultat souhaité.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn