データフレーム間の違いの強調
データ分析では、データセット間の変更を効果的に特定して比較することが重要です。この記事では、2 つの Pandas データフレーム「StudentRoster Jan-1」と「StudentRoster Jan-2」を比較し、それらの違いを並べて出力するための最適な方法を紹介します。
これを実現するには、まず、ブール式 (df1 != df2)。これにより、2 つのデータフレーム間で値が異なる行が特定されます。次に、stack() 関数を利用してブール マスクのフラット化されたビューを作成し、続いてサブセット化して変更されたエントリのみを抽出します。
わかりやすくするために、変更されたデータフレームには、変更されたエントリのインデックスと列名が表示されます。細胞。特定の変更を特定するには、np.where(df1 != df2) を利用してこれらの違いの場所を見つけます。最後に、これらの場所で df1 と df2 から値を抽出し、変更された値を並べて表示するデータフレームを作成します。
このアプローチを採用することで、データフレーム間の変更を簡単に特定して分析できます。意思決定とデータ探索のための貴重な洞察が得られます。
以上が2 つの Pandas DataFrame を比較し、並べて違いを強調表示する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。