首頁  >  文章  >  後端開發  >  如何有效地並排比較資料幀以進行深入的變化分析?

如何有效地並排比較資料幀以進行深入的變化分析?

Linda Hamilton
Linda Hamilton原創
2024-10-22 20:51:43624瀏覽

How to Efficiently Compare DataFrames Side-by-Side for In-depth Change Analysis?

並排比較資料幀以進行全面的變化分析

為了突出顯示兩個資料幀之間的差異,存在一種有效的方法來消除這種需要用於費力的逐行和逐列比較。透過利用特定的 Python Pandas 函數,可以找出各種資料類型(例如 int、float、boolean、string)的變化,並以直覺的 HTML 表格格式呈現它們。

首先,確定是否存在任何變化使用布林函數 (df1 != df2).any(1) 更改了行。接下來,要識別已更改的特定條目,請使用ne_stacked = (df1 != df2).stack() 並使用changed = ne_stacked[ne_stacked].

過濾掉未更改的值來獲取實際更改的值值,合併Difference_locations = np.where(df1 != df2),它標識更改資料的位置。使用changed_from = df1.values[difference_locations]從這些位置的原始資料幀(df1)中提取值。類似地,使用changed_to = df2.values[difference_locations]從第二個dataframe(df2)中提取對應的值。

為了全面呈現差異,透過將changed_from和changed_to組合為列並設定索引來建立DataFrame以匹配更改的變數。此資料框將提供變更的清晰並排視圖,突出顯示每個資料點的原始值和更新值。

以上是如何有效地並排比較資料幀以進行深入的變化分析?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn