首頁  >  文章  >  後端開發  >  如何辨識 Python 中兩個 Dataframe 之間的差異?

如何辨識 Python 中兩個 Dataframe 之間的差異?

Linda Hamilton
Linda Hamilton原創
2024-10-19 21:12:01156瀏覽

How to Identify Differences Between Two Dataframes in Python?

比較兩個資料幀以識別差異

要比較兩個資料幀df1 和df2,並確定它們之間的差異,可以執行以下步驟採取:

由於提供的程式碼df1 != df2 僅適用於具有相同行和列的資料幀,因此需要一種替代方法。將兩個資料幀連接成一個資料幀 df,可以進行更徹底的比較。

<code class="python">import pandas as pd

df = pd.concat([df1, df2])</code>

連接後,重設 df 的索引以避免潛在的索引衝突。

<code class="python">df = df.reset_index(drop=True)</code>

以每一列將資料框分組,以識別唯一記錄。

<code class="python">df_gpby = df.groupby(list(df.columns))</code>

提取唯一記錄的索引,其中組的長度為 1。

<code class="python">idx = [x[0] for x in df_gpby.groups.values() if len(x) == 1]</code>

基於過濾資料框在唯一索引上取得 df1 和 df2 之間的差異。

<code class="python">result = df.reindex(idx)</code>

產生的結果資料幀將包含 df2 中但不包含 df1 中的行。

以上是如何辨識 Python 中兩個 Dataframe 之間的差異?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn