fillna() の機能を利用して列全体で欠損値を代入する
データ操作の領域では、多くの場合、これが必要になります。欠損値を代入してデータの整合性を確保します。多用途のデータ分析ライブラリである Pandas は、このタスクを効率的に処理するために fillna() メソッドを提供します。ただし、欠損値を列全体で埋めるように機能を拡張するには、特定のアプローチが必要です。
ある列の欠損値を別の列の対応する値で埋めるというこれまでの試みでは、非効率な行ごとのループが発生することがよくありました。パフォーマンスを最適化し、ベスト プラクティスを遵守するには、fillna() を利用する代替メソッドが不可欠です。
列全体を引数として fillna() に効果的に渡す方法は次のとおりです。
import pandas as pd # Create a DataFrame with missing values df = pd.DataFrame({'Day': [1, 2, 3, 4], 'Cat1': ['cat', 'dog', 'cat', np.nan], 'Cat2': ['mouse', 'elephant', 'giraf', 'ant']}) # Fill missing values in Cat1 using values from Cat2 df['Cat1'].fillna(df['Cat2'], inplace=True) # Display the imputed DataFrame print(df)
このコードは、4 行目の「Cat1」の欠損値を、「Cat2」の対応する行から抽出された「ant」で正常に埋めます。結果として得られる DataFrame は完全なデータを示し、その後の分析での有効性が保証されます。
列引数を受け入れる fillna() の機能を活用することで、1 回の操作で欠損値を別の列のデータで効率的に代入できます。このアプローチはデータ品質を向上させるだけでなく、計算効率も最適化するため、データ ラングリング ツールボックスに不可欠なツールになります。
以上がPandas で、ある列の欠損値を別の列のデータで埋めるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。