ホームページ >バックエンド開発 >Python チュートリアル >Pandas DataFrame で NaN 値を効率的に置き換えるにはどうすればよいですか?

Pandas DataFrame で NaN 値を効率的に置き換えるにはどうすればよいですか?

Barbara Streisand
Barbara Streisandオリジナル
2024-12-30 20:38:13152ブラウズ

How Can I Efficiently Replace NaN Values in a Pandas DataFrame?

Pandas DataFrame での NaN の効率的な置換

データ分析では、Null 値または NaN が問題を引き起こす可能性があります。たとえば、NaN を含む pandas DataFrame を考えてみましょう。

import pandas as pd
df = pd.DataFrame([[1, 2, 3], [4, None, None], [None, None, 9]])

これらの NaN を効果的に処理するには、NaN を論理値に置き換える洗練されたソリューションを模索します。

前方充填アプローチ

効率的でループのない方法の 1 つは、ffill パラメーターを指定して fillna メソッドを利用することです。この操作は、最後に観測された値を前方に伝播し、後続の NaN を置き換えます。指定された DataFrame の場合、次の結果が得られます。

df.fillna(method='ffill')
   0  1  2
0  1  2  3
1  4  2  3
2  4  2  9

後方充填アプローチ

あるいは、NaN を同じ列内の最も近い値に置き換える場合、逆方向が必要な場合は、bfill パラメータを使用できます。このメソッドは、最初に観測された値を逆方向に伝播し、NaN を埋めます。

インプレース変更

デフォルトでは、fillna メソッドは元の DataFrame を変更しません。変更を永続的に適用するには、inplace=True を使用します。

df.fillna(method='ffill', inplace=True)

この操作は df を直接更新し、指定されたメソッドに従ってすべての NaN を置き換えます。

結論

fillna メソッドの柔軟性を活用することで、パンダ データフレーム内の NaN を前方および後方の両方で効率的に置き換えることができます。充填技術により、分析用にクリーンで完全なデータを確保します。

以上がPandas DataFrame で NaN 値を効率的に置き換えるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。