處理表格資料時,缺失值是常見現象,可能會阻礙分析。 pandas fillna() 方法提供了一個簡單有效的解決方案,可以用所需值取代這些空值。然而,透過 fillna() 直接為缺失的單元格分配特定值可能效率低且耗時,尤其是對於大型資料集。
為了克服這個限制,pandas 提供了一個強大的功能,使您能夠使用以下命令填充缺失值來自另一列的相應元素。這種方法消除了對每行進行手動迭代的需要,從而顯著提高了效能和可維護性。
請考慮以下範例,您希望使用「Cat2」中的值填入「Cat1」欄位中的缺失值
Day | Cat1 | Cat2 |
---|---|---|
1 | cat | mouse |
2 | dog | elephant |
3 | cat | giraf |
4 | NaN | ant |
Day | Cat1 | Cat2 |
---|---|---|
1 | cat | mouse |
2 | dog | elephant |
3 | cat | giraf |
4 | ant | ant |
df['Cat1'].fillna(df['Cat2'])>使用fillna()方法,您可以輕鬆完成此任務:此程式碼將毫不費力地將「Cat1」中的缺失值替換為「Cat2」中的對應值,從而保留資料結構並防止引入不正確或不一致的值。產生的 DataFrame 將具有完整且一致的數據,可供進一步分析或處理。
以上是如何使用 pandas 中另一列的對應值有效地填入一列中的缺失值?的詳細內容。更多資訊請關注PHP中文網其他相關文章!