首頁 >後端開發 >Python教學 >為什麼具有多個條件的 Pandas 索引會表現出意外的行為?

為什麼具有多個條件的 Pandas 索引會表現出意外的行為?

Mary-Kate Olsen
Mary-Kate Olsen原創
2024-10-25 09:47:02265瀏覽

Why Does Pandas Indexing with Multiple Conditions Exhibit Unexpected Behavior?

Pandas 多條件索引:意外行為

對於 pandas,將過濾器應用於 DataFrame 是一種常見操作。但是,當使用多個條件時,尤其是使用 AND 和 OR 等邏輯運算符時,可能會出現意外結果。

問題:

根據兩列中的值過濾行時,AND 運算符的行為類似於 OR,反之亦然。例如,下面的程式碼應該:

  • 使用 AND 運算子排除任一列值為 -1 的行。
  • 使用 OR 運算子排除兩個欄位值都為 -1 的行。 -1.
<code class="python">df = pd.DataFrame({'a': range(5), 'b': range(5) })

df['a'][1] = -1
df['b'][1] = -1
df['a'][3] = -1
df['b'][4] = -1

df1 = df[(df.a != -1) & (df.b != -1)]
df2 = df[(df.a != -1) | (df.b != -1)]

print(pd.concat([df, df1, df2], axis=1,
                keys=['original df', 'using AND (&)', 'using OR (|)',]))</code>

解釋:

意外行為源自於邏輯運算子在 pandas 索引上下文中的解釋方式。

  • AND 運算子:

    • df[(df.a != -1) & (df.b != - 1)] 表示「保留df.a 不為-1 且df.b 不為-1 的行」。
    • 這將過濾掉至少一個值為 -1 的行。
  • 或運算子:

    • df[(df.a != -1) | (df.b>
    • df[(df.a != -1) | != -1)] 表示「保留df.a 或df.b 不為-1 的行」。
    • 這會過濾掉兩個值為 -1 的行。

因此,AND 運算子的行為類似於 OR,因為它根據任一列中不存在 -1 來排除行。相反,OR 運算子的行為類似於 AND,因為只有當兩列都不包含 -1 時它才包含行。

附加說明:

  • 建議使用.loc 和.iloc 而不是鍊式索引(例如df'a' = -1),以實現更清晰、更安全的程式碼實踐。

以上是為什麼具有多個條件的 Pandas 索引會表現出意外的行為?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn