首頁  >  文章  >  後端開發  >  如何比較兩個 Pandas DataFrame 並並排突出顯示差異?

如何比較兩個 Pandas DataFrame 並並排突出顯示差異?

Patricia Arquette
Patricia Arquette原創
2024-10-22 21:54:03856瀏覽

How to Compare Two Pandas DataFrames and Highlight Differences Side-by-Side?

突出 DataFrame 之間的差異

在數據分析中,有效識別和比較數據集之間的變化至關重要。本文提出了一種比較兩個 Pandas 資料框「StudentRoster Jan-1」和「StudentRoster Jan-2」的最佳方法,並並排輸出它們的差異。

為了實現這一點,我們先利用布林表達式 (df1 != df2)。這標識了兩個資料幀之間值不同的行。接下來,我們利用 stack() 函數來建立布林遮罩的扁平化視圖,然後進行子集化以僅提取變更的條目。

為了清楚起見,更改的資料幀顯示了修改後的索引和列名稱細胞。為了確定具體的變化,我們利用 np.where(df1 != df2) 來找出這些差異的位置。最後,我們從這些位置的 df1 和 df2 中提取值,並建立一個資料幀來並排顯示修改後的值。

透過採用這種方法,我們可以輕鬆地找出和分析資料幀之間的變化,提供對於決策和資料探索來說非常寶貴的見解。

以上是如何比較兩個 Pandas DataFrame 並並排突出顯示差異?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn