Heim > Artikel > Backend-Entwicklung > Wie führen Sie DataFrames in Pandas nach Index zusammen und welche verschiedenen Arten der Zusammenführung sind verfügbar?
DataFrames nach Index zusammenführen: Eine umfassende Anleitung
Das Zusammenführen zweier DataFrames basierend auf ihren Indizes ist eine häufige Datenmanipulationsaufgabe. Es kann jedoch zu Fehlern oder unerwartetem Verhalten kommen, wenn die Zusammenführung nicht korrekt angegangen wird. In diesem Leitfaden werden wir uns mit den verschiedenen Methoden des Zusammenführens nach Index befassen und ihre wichtigsten Unterschiede und potenziellen Fallstricke hervorheben.
Zusammenführungsfunktionen verstehen
In der Pandas-Bibliothek von Python Zum Zusammenführen von DataFrames stehen mehrere Funktionen zur Verfügung: Merge, Join und Concat. Jede Funktion hat ihren eigenen Standard-Join-Typ:
Zusammenführen nach Index
Um zwei DataFrames nach Index zusammenzuführen, müssen wir die Parameter left_index und right_index angeben in den Merge- oder Join-Funktionen. Dadurch wird Pandas angewiesen, die Zeilenbeschriftungen (Indizes) der DataFrames als Verbindungsschlüssel zu verwenden.
Beispiel:
Betrachten Sie die folgenden zwei DataFrames:
<code class="python">df1 = pd.DataFrame({'a': range(6), 'b': [5, 3, 6, 9, 2, 4]}, index=list('abcdef')) df2 = pd.DataFrame({'c': range(4), 'd': [10, 20, 30, 40]}, index=list('abhi'))</code>
Inner Join (Standard):
So führen Sie einen Inner Join mit der Zusammenführungsfunktion durch:
<code class="python">pd.merge(df1, df2, left_index=True, right_index=True)</code>
Ausgabe:
a b c d a 0 5 0 10 b 1 3 1 20
Left Join (Standard):
So führen Sie einen Left Join mit der Join-Funktion durch:
<code class="python">df1.join(df2)</code>
Ausgabe:
a b c d a 0 5 0.0 10.0 b 1 3 1.0 20.0 c 2 6 NaN NaN d 3 9 NaN NaN e 4 2 NaN NaN f 5 4 NaN NaN
Äußerer Join:
So führen Sie einen äußeren Join mit der Concat-Funktion durch:
<code class="python">pd.concat([df1, df2], axis=1)</code>
Ausgabe:
a b c d a 0.0 5.0 0.0 10.0 b 1.0 3.0 1.0 20.0 c 2.0 6.0 NaN NaN d 3.0 9.0 NaN NaN e 4.0 2.0 NaN NaN f 5.0 4.0 NaN NaN h NaN NaN 2.0 30.0 i NaN NaN 3.0 40.0
Wichtige Hinweise:
Das obige ist der detaillierte Inhalt vonWie führen Sie DataFrames in Pandas nach Index zusammen und welche verschiedenen Arten der Zusammenführung sind verfügbar?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!