首頁 >後端開發 >Python教學 >如何有效填滿 Pandas DataFrame 中的缺失值?

如何有效填滿 Pandas DataFrame 中的缺失值?

Susan Sarandon
Susan Sarandon原創
2024-11-11 10:30:03759瀏覽

How to Efficiently Fill Missing Values in Pandas DataFrames?

填滿 DataFrame 中的缺失值:高效方法

在 pandas 中,當處理不完整的資料集時,通常需要填入缺失值。雖然迭代每一行的效率很低,但 fillna 提供了一個方便的解決方案來填充跨列的缺失值。

考慮以下DataFrame,其中「Cat1」欄位缺少值:

        Day  Cat1  Cat2
0         1    cat   mouse
1         2    dog   elephant
2         3    cat   giraf
3         4    NaN   ant

To使用「Cat2」中的值填入第四行「Cat1」的缺失值,我們可以使用fillna 方法,如下所示:

df['Cat1'].fillna(df['Cat2'])

此方法提供了一種快速且節省記憶體的解決方案來填充缺失值大型資料集中的值。 fillna 方法以另一列作為參數,並使用匹配的索引來替換缺失值。

結果:

        Day  Cat1  Cat2
0         1    cat   mouse
1         2    dog   elephant
2         3    cat   giraf
3         4    ant   ant

透過利用這種高效的方法來填充 pandas 中的缺失值,開發人員可以確保資料完整性並提高資料分析的準確性。

以上是如何有效填滿 Pandas DataFrame 中的缺失值?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn