取代 Dataframe 欄位中的 NaN 值
在 Pandas 中使用 DataFrame 時,遺失或無效的資料可以用 NaN 值表示。為了確保資料品質並防止錯誤,通常需要用適當的佔位符或插補來替換這些 NaN 值。
DataFrame.fillna() 方法
最直接的替換 NaN 值的方法是使用 fillna() 方法。它將一個值或字典作為參數,並用提供的值替換指定列或整個 DataFrame 中的所有 NaN值
範例:
import pandas as pd df = pd.DataFrame({ "itm": [420, 421, 421, 421, 421, 485, 485, 485, 485, 489, 489], "Date": ["2012-09-30", "2012-09-09", "2012-09-16", "2012-09-23", "2012-09-30", "2012-09-09", "2012-09-16", "2012-09-23", "2012-09-30", "2012-09-09", "2012-09-16"], "Amount": [65211, 29424, 29877, 30990, 61303, 71781, float("NaN"), 11072, 113702, 64731, float("NaN")] }) df.fillna(0)
輸出:
itm Date Amount 0 420 2012-09-30 65211 1 421 2012-09-09 29424 2 421 2012-09-16 29877 3 421 2012-09-23 30990 4 421 2012-09-30 61303 5 485 2012-09-09 71781 6 485 2012-09-16 0.0 7 485 2012-09-23 11072.0 8 485 2012-09-30 113702.0 9 489 2012-09-09 64731 10 489 2012-09-16 0.0
其他方法:其他方法>
雖然fillna()是最常見的是,還有其他幾種方法可用於取代NaN 值:結論:
取代 DataFrame 中的 NaN 值對於資料清理和操作至關重要。透過利用上述方法,您可以有效處理遺失或無效的數據,確保數據分析的完整性和品質。以上是如何有效地替換 Pandas DataFrame 中的 NaN 值?的詳細內容。更多資訊請關注PHP中文網其他相關文章!