Heim >Backend-Entwicklung >Python-Tutorial >Wie kann ich mehrere Pandas-DataFrames mit überlappenden Spalten effizient zusammenführen?
Kombinieren mehrerer Datenrahmen mithilfe von Drei-Wege-Verknüpfungen in Pandas
Angenommen mehrere CSV-Dateien mit überlappenden Personennamen als erste Spalte, lautet die Aufgabe um diese Dateien in einer einzigen CSV-Datei zusammenzuführen, wobei jede Zeile alle Attribute für eine eindeutige Person enthält.
Die traditionelle Funktion „join()“ in Pandas erfordert eine hierarchische Indizierung. Es steht jedoch ein alternativer Ansatz zur Verfügung, um den Zusammenführungsprozess zu vereinfachen.
Reduzierungsfunktion für das Zusammenführen von Datenrahmen
Eine effiziente Möglichkeit, Datenrahmen zusammenzuführen, ist die Verwendung der Funktion functools.reduce zusammen mit der pd.merge-Funktion. So würde der Code aussehen:
import functools as ft dfs = [df0, df1, df2, ..., dfN] df_final = ft.reduce(lambda left, right: pd.merge(left, right, on='name'), dfs)
Dieser Ansatz ermöglicht das Zusammenführen einer beliebigen Anzahl von Datenrahmen mit einer gemeinsamen „Name“-Spalte.
Das obige ist der detaillierte Inhalt vonWie kann ich mehrere Pandas-DataFrames mit überlappenden Spalten effizient zusammenführen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!