首頁 >後端開發 >Python教學 >如何有效地替換 Pandas DataFrame 中的 NaN 值?

如何有效地替換 Pandas DataFrame 中的 NaN 值?

Susan Sarandon
Susan Sarandon原創
2024-12-03 20:16:10355瀏覽

How can I effectively replace NaN values in Pandas DataFrames?

取代 Dataframe 欄位中的 NaN 值

在 Pandas 中使用 DataFrame 時,遺失或無效的資料可以用 NaN 值表示。為了確保資料品質並防止錯誤,通常需要用適當的佔位符或插補來替換這些 NaN 值。

DataFrame.fillna() 方法

最直接的替換 NaN 值的方法是使用 fillna() 方法。它將一個值或字典作為參數,並用提供的值替換指定列或整個 DataFrame 中的所有 NaN值

範例:

import pandas as pd

df = pd.DataFrame({
    "itm": [420, 421, 421, 421, 421, 485, 485, 485, 485, 489, 489],
    "Date": ["2012-09-30", "2012-09-09", "2012-09-16", "2012-09-23", "2012-09-30", 
             "2012-09-09", "2012-09-16", "2012-09-23", "2012-09-30", "2012-09-09", "2012-09-16"],
    "Amount": [65211, 29424, 29877, 30990, 61303, 71781, float("NaN"), 11072, 113702, 64731, float("NaN")]
})

df.fillna(0)

輸出:

       itm       Date    Amount
0     420  2012-09-30    65211
1     421  2012-09-09    29424
2     421  2012-09-16    29877
3     421  2012-09-23    30990
4     421  2012-09-30    61303
5     485  2012-09-09    71781
6     485  2012-09-16      0.0
7     485  2012-09-23   11072.0
8     485  2012-09-30  113702.0
9     489  2012-09-09    64731
10    489  2012-09-16      0.0

其他方法:其他方法>

雖然fillna()是最常見的是,還有其他幾種方法可用於取代NaN 值:

  • .replace():此方法可用於將NaN 值替換為特定值或掩碼。
  • .interpolate():此方法使用各種插值技術來估計缺失
  • .pivot_table():此方法可用於對資料進行分組和聚合,忽略缺失值。

結論:

取代 DataFrame 中的 NaN 值對於資料清理和操作至關重要。透過利用上述方法,您可以有效處理遺失或無效的數據,確保數據分析的完整性和品質。

以上是如何有效地替換 Pandas DataFrame 中的 NaN 值?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn