Heim >Backend-Entwicklung >Python-Tutorial >So identifizieren und zeigen Sie Unterschiede zwischen DataFrames einfach an
Vergleichen Sie Datenrahmen und zeigen Sie Unterschiede nebeneinander an
Um Datendiskrepanzen zu identifizieren, besteht häufig die Notwendigkeit, zwei Datenrahmen zu vergleichen und markieren Sie die Änderungen zwischen ihnen. Betrachten Sie das folgende Beispiel:
"StudentRoster Jan-1": id Name score isEnrolled Comment 111 Jack 2.17 True He was late to class 112 Nick 1.11 False Graduated 113 Zoe 4.12 True "StudentRoster Jan-2": id Name score isEnrolled Comment 111 Jack 2.17 True He was late to class 112 Nick 1.21 False Graduated 113 Zoe 4.12 False On vacation
Um die gewünschte Ausgabe zu erzielen, ermitteln Sie zunächst die Zeilen, in denen Änderungen vorgenommen wurden:
ne = (df1 != df2).any(1)
Identifizieren Sie als Nächstes die spezifischen Einträge, die geändert wurden:
ne_stacked = (df1 != df2).stack() changed = ne_stacked[ne_stacked] changed.index.names = ['id', 'col']
Fahren Sie mit dem Extrahieren der ursprünglichen und aktualisierten Werte für die geänderten Einträge fort:
difference_locations = np.where(df1 != df2) changed_from = df1.values[difference_locations] changed_to = df2.values[difference_locations]
Stellen Sie abschließend die Unterschiede in einem benutzerfreundlichen Tabellenformat dar:
pd.DataFrame({'from': changed_from, 'to': changed_to}, index=changed.index)
Dieser Ansatz bietet eine umfassende Zusammenfassung der Unterschiede zwischen zwei Datenrahmen, hebt sowohl die geänderten Werte als auch ihre Positionen hervor und ermöglicht so eine schnelle und effiziente Analyse von Datendiskrepanzen.
Das obige ist der detaillierte Inhalt vonSo identifizieren und zeigen Sie Unterschiede zwischen DataFrames einfach an. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!