Maison  >  Article  >  développement back-end  >  Comment remplacer les valeurs manquantes dans les DataFrames Pandas par des moyennes de colonnes ?

Comment remplacer les valeurs manquantes dans les DataFrames Pandas par des moyennes de colonnes ?

Barbara Streisand
Barbara Streisandoriginal
2024-10-28 18:33:021024parcourir

How to Replace Missing Values in Pandas DataFrames with Column Averages?

Remplacement des valeurs NaN par des moyennes de colonnes dans les DataFrames Pandas

Lorsque vous travaillez avec des DataFrames Pandas, il est courant de rencontrer des valeurs NaN (manquantes). Pour gérer efficacement ces valeurs, il est crucial de les remplacer par des valeurs appropriées. Un moyen efficace consiste à remplacer les valeurs NaN par la moyenne de leurs colonnes respectives.

Solution utilisant DataFrame.fillna

Contrairement à l'approche mentionnée dans la question référencée, les pandas DataFrames peut être traité différemment. La méthode DataFrame.fillna fournit une solution simple pour remplir les valeurs NaN :

<code class="python">df.fillna(df.mean())</code>

Explication détaillée :

  • La fonction df.mean() calcule le moyenne de chaque colonne du DataFrame.
  • La méthode fillna prend les moyennes calculées et remplit les valeurs NaN dans chaque colonne avec la moyenne correspondante.

Exemple :

Considérons le DataFrame suivant :

          A         B         C
0 -0.166919  0.979728 -0.632955
1 -0.297953 -0.912674 -1.365463
2 -0.120211 -0.540679 -0.680481
3       NaN -2.027325  1.533582
4       NaN       NaN  0.461821
5 -0.788073       NaN       NaN
6 -0.916080 -0.612343       NaN
7 -0.887858  1.033826       NaN
8  1.948430  1.025011 -2.982224
9  0.019698 -0.795876 -0.046431

Après avoir appliqué la méthode fillna avec des moyennes :

          A         B         C
0 -0.166919  0.979728 -0.632955
1 -0.297953 -0.912674 -1.365463
2 -0.120211 -0.540679 -0.680481
3 -0.151121 -2.027325  1.533582
4 -0.151121 -0.231291  0.461821
5 -0.788073 -0.231291 -0.530307
6 -0.916080 -0.612343 -0.530307
7 -0.887858  1.033826 -0.530307
8  1.948430  1.025011 -2.982224
9  0.019698 -0.795876 -0.046431

Comme démontré, les valeurs NaN ont été remplacées par les moyennes des colonnes correspondantes.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn