ホームページ >バックエンド開発 >Python チュートリアル >Pandas DataFrame の NaN 値を列平均に置き換える方法は?
pandas DataFrame では、正確な分析のために欠損データの処理が重要です。不完全なデータに遭遇した場合は、NaN 値を意味のある推定値に置き換える必要があります。この記事では、NaN 値を pandas DataFrame のそれぞれの列の平均に置き換える方法を示します。
実数と NaN 値が混在する DataFrame を考えてみましょう。目標は、NaN 値を、それが表示される列の平均値で置き換えることです。
NumPy 配列とは異なり、pandas DataFrame に NaN 値を埋めることは、 fillna メソッド:
<code class="python">df.fillna(df.mean())</code>
このメソッドは、NaN 値を対応する列の平均で埋めます。例:
<code class="python">df = pd.DataFrame({'A': [-0.166919, -0.297953, -0.120211, np.nan, np.nan, -0.788073, -0.916080, -0.887858, 1.948430, 0.019698], 'B': [0.979728, -0.912674, -0.540679, -2.027325, np.nan, np.nan, -0.612343, 1.033826, 1.025011, -0.795876], 'C': [-0.632955, -1.365463, -0.680481, 1.533582, 0.461821, np.nan, np.nan, np.nan, -2.982224, -0.046431]}) mean = df.mean() print(df.fillna(mean))</code>
出力:
A B C 0 -0.166919 0.979728 -0.632955 1 -0.297953 -0.912674 -1.365463 2 -0.120211 -0.540679 -0.680481 3 -0.151121 -2.027325 1.533582 4 -0.151121 -0.231291 0.461821 5 -0.788073 -0.231291 -0.530307 6 -0.916080 -0.612343 -0.530307 7 -0.887858 1.033826 -0.530307 8 1.948430 1.025011 -2.982224 9 0.019698 -0.795876 -0.046431
NaN 値は、それぞれの列の平均値に置き換えられました。
以上がPandas DataFrame の NaN 値を列平均に置き換える方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。