Heim  >  Artikel  >  Backend-Entwicklung  >  So identifizieren und zeigen Sie Unterschiede zwischen DataFrames einfach an

So identifizieren und zeigen Sie Unterschiede zwischen DataFrames einfach an

DDD
DDDOriginal
2024-10-22 20:50:05275Durchsuche

How to Easily Identify and Display Differences Between DataFrames

Vergleichen Sie Datenrahmen und zeigen Sie Unterschiede nebeneinander an

Um Datendiskrepanzen zu identifizieren, besteht häufig die Notwendigkeit, zwei Datenrahmen zu vergleichen und markieren Sie die Änderungen zwischen ihnen. Betrachten Sie das folgende Beispiel:

"StudentRoster Jan-1":
id    Name   score                    isEnrolled           Comment
111   Jack   2.17                     True                 He was late to class
112   Nick   1.11                     False                Graduated
113   Zoe    4.12                     True

"StudentRoster Jan-2":
id    Name   score                    isEnrolled           Comment
111   Jack   2.17                     True                 He was late to class
112   Nick   1.21                     False                Graduated
113   Zoe    4.12                     False                On vacation

Um die gewünschte Ausgabe zu erzielen, ermitteln Sie zunächst die Zeilen, in denen Änderungen vorgenommen wurden:

ne = (df1 != df2).any(1)

Identifizieren Sie als Nächstes die spezifischen Einträge, die geändert wurden:

ne_stacked = (df1 != df2).stack()
changed = ne_stacked[ne_stacked]
changed.index.names = ['id', 'col']

Fahren Sie mit dem Extrahieren der ursprünglichen und aktualisierten Werte für die geänderten Einträge fort:

difference_locations = np.where(df1 != df2)
changed_from = df1.values[difference_locations]
changed_to = df2.values[difference_locations]

Stellen Sie abschließend die Unterschiede in einem benutzerfreundlichen Tabellenformat dar:

pd.DataFrame({'from': changed_from, 'to': changed_to}, index=changed.index)

Dieser Ansatz bietet eine umfassende Zusammenfassung der Unterschiede zwischen zwei Datenrahmen, hebt sowohl die geänderten Werte als auch ihre Positionen hervor und ermöglicht so eine schnelle und effiziente Analyse von Datendiskrepanzen.

Das obige ist der detaillierte Inhalt vonSo identifizieren und zeigen Sie Unterschiede zwischen DataFrames einfach an. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn