Maison >développement back-end >Tutoriel Python >Comment remplacer les valeurs manquantes dans les DataFrames Pandas par des moyennes de colonnes ?
Remplacement des valeurs NaN par des moyennes de colonnes dans les DataFrames Pandas
Lorsque vous travaillez avec des DataFrames Pandas, il est courant de rencontrer des valeurs NaN (manquantes). Pour gérer efficacement ces valeurs, il est crucial de les remplacer par des valeurs appropriées. Un moyen efficace consiste à remplacer les valeurs NaN par la moyenne de leurs colonnes respectives.
Solution utilisant DataFrame.fillna
Contrairement à l'approche mentionnée dans la question référencée, les pandas DataFrames peut être traité différemment. La méthode DataFrame.fillna fournit une solution simple pour remplir les valeurs NaN :
<code class="python">df.fillna(df.mean())</code>
Explication détaillée :
Exemple :
Considérons le DataFrame suivant :
A B C 0 -0.166919 0.979728 -0.632955 1 -0.297953 -0.912674 -1.365463 2 -0.120211 -0.540679 -0.680481 3 NaN -2.027325 1.533582 4 NaN NaN 0.461821 5 -0.788073 NaN NaN 6 -0.916080 -0.612343 NaN 7 -0.887858 1.033826 NaN 8 1.948430 1.025011 -2.982224 9 0.019698 -0.795876 -0.046431
Après avoir appliqué la méthode fillna avec des moyennes :
A B C 0 -0.166919 0.979728 -0.632955 1 -0.297953 -0.912674 -1.365463 2 -0.120211 -0.540679 -0.680481 3 -0.151121 -2.027325 1.533582 4 -0.151121 -0.231291 0.461821 5 -0.788073 -0.231291 -0.530307 6 -0.916080 -0.612343 -0.530307 7 -0.887858 1.033826 -0.530307 8 1.948430 1.025011 -2.982224 9 0.019698 -0.795876 -0.046431
Comme démontré, les valeurs NaN ont été remplacées par les moyennes des colonnes correspondantes.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!