ホームページ  >  記事  >  バックエンド開発  >  Pandas DataFrame の NaN 値を列平均に置き換える方法は?

Pandas DataFrame の NaN 値を列平均に置き換える方法は?

Linda Hamilton
Linda Hamiltonオリジナル
2024-10-30 07:01:28113ブラウズ

How to Replace NaN Values in a Pandas DataFrame with Column Averages?

Pandas DataFrame: NaN 値を列平均で置き換える

pandas DataFrame では、正確な分析のために欠損データの処理が重要です。不完全なデータに遭遇した場合は、NaN 値を意味のある推定値に置き換える必要があります。この記事では、NaN 値を pandas DataFrame のそれぞれの列の平均に置き換える方法を示します。

問題

実数と NaN 値が混在する DataFrame を考えてみましょう。目標は、NaN 値を、それが表示される列の平均値で置き換えることです。

解決策

NumPy 配列とは異なり、pandas DataFrame に NaN 値を埋めることは、 fillna メソッド:

<code class="python">df.fillna(df.mean())</code>

このメソッドは、NaN 値を対応する列の平均で埋めます。例:

<code class="python">df = pd.DataFrame({'A': [-0.166919, -0.297953, -0.120211, np.nan, np.nan, -0.788073, -0.916080, -0.887858, 1.948430, 0.019698],
                   'B': [0.979728, -0.912674, -0.540679, -2.027325, np.nan, np.nan, -0.612343, 1.033826, 1.025011, -0.795876],
                   'C': [-0.632955, -1.365463, -0.680481, 1.533582, 0.461821, np.nan, np.nan, np.nan, -2.982224, -0.046431]})

mean = df.mean()
print(df.fillna(mean))</code>

出力:

          A         B         C
0 -0.166919  0.979728 -0.632955
1 -0.297953 -0.912674 -1.365463
2 -0.120211 -0.540679 -0.680481
3 -0.151121 -2.027325  1.533582
4 -0.151121 -0.231291  0.461821
5 -0.788073 -0.231291 -0.530307
6 -0.916080 -0.612343 -0.530307
7 -0.887858  1.033826 -0.530307
8  1.948430  1.025011 -2.982224
9  0.019698 -0.795876 -0.046431

NaN 値は、それぞれの列の平均値に置き換えられました。

以上がPandas DataFrame の NaN 値を列平均に置き換える方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。