Maison  >  Article  >  développement back-end  >  Comment comparer deux DataFrames Pandas et mettre en évidence les différences côte à côte ?

Comment comparer deux DataFrames Pandas et mettre en évidence les différences côte à côte ?

Patricia Arquette
Patricia Arquetteoriginal
2024-10-22 21:54:03863parcourir

How to Compare Two Pandas DataFrames and Highlight Differences Side-by-Side?

Mise en évidence des différences entre les DataFrames

Dans l'analyse des données, il est crucial d'identifier et de comparer efficacement les changements entre les ensembles de données. Cet article présente une méthode optimale pour comparer deux dataframes Pandas, "StudentRoster Jan-1" et "StudentRoster Jan-2", et afficher leurs différences côte à côte.

Pour y parvenir, nous utilisons d'abord le expression booléenne (df1 != df2). Cela identifie les lignes où les valeurs diffèrent entre les deux trames de données. Ensuite, nous exploitons la fonction stack() pour créer une vue aplatie du masque booléen, suivie d'un sous-ensemble pour extraire uniquement les entrées modifiées.

Pour plus de clarté, la trame de données modifiée affiche les noms d'index et de colonne des entrées modifiées. cellules. Pour déterminer les changements spécifiques, nous utilisons np.where(df1 != df2) pour trouver les emplacements de ces différences. Enfin, nous extrayons les valeurs de df1 et df2 à ces emplacements et créons un dataframe pour afficher les valeurs modifiées côte à côte.

En employant cette approche, nous pouvons facilement identifier et analyser les changements entre les dataframes, fournissant des informations inestimables pour la prise de décision et l’exploration des données.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn