ホームページ >バックエンド開発 >Python チュートリアル >Python で 2 つのデータフレーム間の違いを特定する方法
相違点を特定するための 2 つのデータフレームの比較
2 つのデータフレーム df1 と df2 を比較し、それらの相違点を確認するには、次の手順を実行します。
提供されたコード df1 != df2 は同一の行と列を持つデータフレームにのみ適用できるため、別のアプローチが必要です。 2 つのデータフレームを 1 つのデータフレーム df に連結すると、より徹底的な比較が可能になります。
<code class="python">import pandas as pd df = pd.concat([df1, df2])</code>
連結したら、潜在的なインデックスの競合を避けるために df のインデックスをリセットします。
<code class="python">df = df.reset_index(drop=True)</code>
各列ごとにデータフレームをグループ化し、一意のレコードを識別します。
<code class="python">df_gpby = df.groupby(list(df.columns))</code>
グループの長さが 1 である一意のレコードのインデックスを抽出します。
<code class="python">idx = [x[0] for x in df_gpby.groups.values() if len(x) == 1]</code>
ベースでデータフレームをフィルタリングします一意のインデックスを使用して df1 と df2 の差を取得します。
<code class="python">result = df.reindex(idx)</code>
結果の結果データフレームには、df2 にはあるが df1 には含まれていない行が含まれます。
以上がPython で 2 つのデータフレーム間の違いを特定する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。