Heim >Backend-Entwicklung >Python-Tutorial >Wie führe ich verschiedene Arten von Pandas DataFrames-Joins durch?

Wie führe ich verschiedene Arten von Pandas DataFrames-Joins durch?

Mary-Kate Olsen
Mary-Kate OlsenOriginal
2024-12-26 10:56:14750Durchsuche

How Do I Perform Different Types of Pandas DataFrames Joins?

Pandas Merging 101: Die Grundlagen

DataFrames VERBINDEN

Beim Zusammenführen von DataFrames in Pandas werden zwei oder mehr DataFrames basierend auf gemeinsamen Schlüsselspalten kombiniert. Es gibt verschiedene Arten von Verknüpfungen, darunter:

  • INNER JOIN: Gibt nur Zeilen zurück, in denen die Schlüssel in beiden DataFrames übereinstimmen.

    • df1 .merge(df2, on='key', how='inner')
  • LEFT JOIN: Beinhaltet alle Zeilen aus dem linken DataFrame und passende Zeilen aus dem rechten DataFrame. Fehlende Werte von rechts werden mit NaNs aufgefüllt.

    • df1.merge(df2, on='key', how='left')
  • RIGHT JOIN: Beinhaltet alle Zeilen aus dem rechten DataFrame und passende Zeilen aus dem linken DataFrame. Fehlende Werte von links werden mit NaNs aufgefüllt.

    • df1.merge(df2, on='key', how='right')
  • VOLLSTÄNDIGER OUTER JOIN: Schließt alle Zeilen aus beiden DataFrames ein und füllt fehlende Werte mit auf NaNs.

    • df1.merge(df2, on='key', how='outer')

Unterschiedliche Schlüsselspaltennamen

Wenn Schlüsselspalten unterschiedliche Namen haben, verwenden Sie left_on und right_on Argumente:

  • df1.merge(df2, left_on='key1', right_on='key2', how='inner')

Vermeiden doppelter Schlüsselspalten in der Ausgabe

Wenn Sie verschiedene Schlüsselspalten zusammenführen, legen Sie den Index vorläufig fest Schritt:

  • df1.set_index('key1').merge(df2, left_index=True, right_on='key2')

Zusammenführen in mehreren Spalten

Verknüpfen Sie mehrere Spalten, indem Sie eine Liste an on (oder left_on und) übergeben right_on):

  • df1.merge(df2, on=['key1', 'key2'], how='inner')

Generalisierung auf mehrere DataFrames

Um mehrere DataFrames zusammenzuführen, verwenden Sie pd.merge_asof für ungefähre Verknüpfungen oder pd.merge_ordered für geordnete Verknüpfungen tritt bei.

Das obige ist der detaillierte Inhalt vonWie führe ich verschiedene Arten von Pandas DataFrames-Joins durch?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn