ホームページ  >  記事  >  バックエンド開発  >  2 つの Pandas DataFrame を比較し、並べて違いを強調表示する方法

2 つの Pandas DataFrame を比較し、並べて違いを強調表示する方法

Patricia Arquette
Patricia Arquetteオリジナル
2024-10-22 21:54:03933ブラウズ

How to Compare Two Pandas DataFrames and Highlight Differences Side-by-Side?

データフレーム間の違いの強調

データ分析では、データセット間の変更を効果的に特定して比較することが重要です。この記事では、2 つの Pandas データフレーム「StudentRoster Jan-1」と「StudentRoster Jan-2」を比較し、それらの違いを並べて出力するための最適な方法を紹介します。

これを実現するには、まず、ブール式 (df1 != df2)。これにより、2 つのデータフレーム間で値が異なる行が特定されます。次に、stack() 関数を利用してブール マスクのフラット化されたビューを作成し、続いてサブセット化して変更されたエントリのみを抽出します。

わかりやすくするために、変更されたデータフレームには、変更されたエントリのインデックスと列名が表示されます。細胞。特定の変更を特定するには、np.where(df1 != df2) を利用してこれらの違いの場所を見つけます。最後に、これらの場所で df1 と df2 から値を抽出し、変更された値を並べて表示するデータフレームを作成します。

このアプローチを採用することで、データフレーム間の変更を簡単に特定して分析できます。意思決定とデータ探索のための貴重な洞察が得られます。

以上が2 つの Pandas DataFrame を比較し、並べて違いを強調表示する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。