首頁 >後端開發 >Python教學 >如何根據查詢修改 Pandas 資料框而不出現意外行為?

如何根據查詢修改 Pandas 資料框而不出現意外行為?

Susan Sarandon
Susan Sarandon原創
2024-11-03 17:25:02477瀏覽

How Can I Modify Pandas Dataframes Based on Queries Without Unexpected Behavior?

了解Pandas 視圖與複製規則

問題陳述

問題陳述

Pandas Python 資料操作庫,提供了一系列選擇和修改資料幀的方法。但是,確定選擇何時建立原始資料幀的副本或其視圖可能會令人困惑。這種歧義會導致在嘗試修改資料時出現意外行為。

簡單規則
  • 為了解決這個混亂,這裡有一些管理Pandas 的查看與複製行為的簡單規則:
  • 所有操作通常都會產生一個副本。
  • 如果指定 inplace=True 參數,則就地進行修改,但只有某些操作支援此功能。
  • 用於設定的索引器(例如.loc、.iloc、.iat、.at)就地設定值。
用於取得單一資料類型物件的索引器通常會傳回一個視圖。然而,由於記憶體佈局的考慮,這種行為並不完全可靠。

用於取得多資料類型物件的索引器總是會建立一個副本。

將規則應用於特定情況
df[df.C <= df.B] = 7654321

讓我們檢查一下您提到的複雜情況:

df[df.C <= df.B].ix[:, 'B':'E']
在這種情況下,適用索引器設定的規則。由於條件涉及兩列的比較,Pandas 會建立資料幀的中間副本來評估條件。然後就地修改該副本。因此,該表達式成功更改了原始資料幀中的值。

但是,鍊式索引表達式:

違反了規則。連結兩個索引器會建立單獨的 Python 操作,使 Pandas 難以可靠地攔截。這可能會導致意外行為,因此強烈建議不要這樣做。

使用查詢修改資料幀
df.loc[df.C <= df.B, 'B':'E'] = 7654321

要根據查詢修改資料幀值,請使用以下方法:此表達式使用單一索引器來評估查詢條件並指定要修改的列子集。它比鍊式索引方法更快、更可靠。

以上是如何根據查詢修改 Pandas 資料框而不出現意外行為?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn