首頁 >後端開發 >Python教學 >如何使用「ffill」和「bfill」高效替換 Pandas DataFrame 中的 NaN 值?

如何使用「ffill」和「bfill」高效替換 Pandas DataFrame 中的 NaN 值?

Patricia Arquette
Patricia Arquette原創
2024-12-01 19:05:10970瀏覽

How to Efficiently Replace NaN Values in Pandas DataFrames using `ffill` and `bfill`?

用Pandas DataFrame 中的前一個或下一個值替換NaN

處理Pandas DataFrame 時,丟失表示為NaN(不是數字)的數據可能會為數據分析帶來挑戰。一項常見任務是將這些 NaN 替換為從現有資料派生的適當值。一個簡單的方法是迭代 DataFrame 並明確修改值。然而,Pandas 提供了更有效的解決方案,可以避免使用循環。

前向填充 (ffill)

用上面的第一個非 NaN 值取代 NaN同一列,使用 fillna 方法和 ffill(向前填充)選項。此方法將最後一個有效觀察向前傳播到後續有效觀察。

import pandas as pd
df = pd.DataFrame([[1, 2, 3], [4, None, None], [None, None, 9]])
df.fillna(method='ffill')

輸出:

   0  1  2
0  1  2  3
1  4  2  3
2  4  2  9

其他注意事項

  • DataFrame 中的第一行不應包含NaN,因為它充當填充。
  • ffill 方法按列操作,這表示它分別填入每列中的 NaN。
  • 要執行向後填充(用下面的下一個非 NaN 值替換 NaN),請使用bfill(向後填充)選項。
  • 要就地修改 DataFrame 而不建立新變量,請將 inplace 參數設為正確:
df.fillna(method='ffill', inplace=True)

以上是如何使用「ffill」和「bfill」高效替換 Pandas DataFrame 中的 NaN 值?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn