Maison >développement back-end >Tutoriel Python >Comment filtrer un DataFrame Pandas pour conserver uniquement les lignes avec des valeurs non NaN dans une colonne spécifique ?
Comment isoler des valeurs non-NaN dans une colonne d'un DataFrame Pandas
Question :
Considérez un DataFrame comme ceci :
STK_ID RPT_Date <br>601166 20111231 601166 NaN NaN<br>600036 20111231 600036 NaN 12<br>600016 20111231 600016 4,3 NaN<br>601009 20111231 601009 NaN NaN<br>601939 20111231 601939 2,5 NaN<br>000001 20111231 000001 NaN NaN<br>
Objectif :
Isoler les enregistrements dont la colonne "EPS" n'est pas NaN, ce qui donne ce DataFrame :
STK_ID RPT_Date <br>600016 20111231 600016 4.3 NaN<br>601939 20111231 601939 2.5 NaN<br>
Solution :
Au lieu de supprimer des lignes, vous pouvez filtrer les DataFrame utilisant la méthode notna() pour sélectionner uniquement les lignes où la colonne "EPS" n'est pas NaN :
df = df[df['EPS'].notna()]
Cela créera un nouveau DataFrame avec le résultat souhaité.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!