ホームページ  >  記事  >  バックエンド開発  >  Python で 2 つのデータフレーム間の違いを特定する方法

Python で 2 つのデータフレーム間の違いを特定する方法

Linda Hamilton
Linda Hamiltonオリジナル
2024-10-19 21:12:01156ブラウズ

How to Identify Differences Between Two Dataframes in Python?

相違点を特定するための 2 つのデータフレームの比較

2 つのデータフレーム df1 と df2 を比較し、それらの相違点を確認するには、次の手順を実行します。

提供されたコード df1 != df2 は同一の行と列を持つデータフレームにのみ適用できるため、別のアプローチが必要です。 2 つのデータフレームを 1 つのデータフレーム df に連結すると、より徹底的な比較が可能になります。

<code class="python">import pandas as pd

df = pd.concat([df1, df2])</code>

連結したら、潜在的なインデックスの競合を避けるために df のインデックスをリセットします。

<code class="python">df = df.reset_index(drop=True)</code>

各列ごとにデータフレームをグループ化し、一意のレコードを識別します。

<code class="python">df_gpby = df.groupby(list(df.columns))</code>

グループの長さが 1 である一意のレコードのインデックスを抽出します。

<code class="python">idx = [x[0] for x in df_gpby.groups.values() if len(x) == 1]</code>

ベースでデータフレームをフィルタリングします一意のインデックスを使用して df1 と df2 の差を取得します。

<code class="python">result = df.reindex(idx)</code>

結果の結果データフレームには、df2 にはあるが df1 には含まれていない行が含まれます。

以上がPython で 2 つのデータフレーム間の違いを特定する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。