Heim  >  Artikel  >  Backend-Entwicklung  >  Wie füge ich DataFrames zusammen und füge Spalten aus beiden hinzu?

Wie füge ich DataFrames zusammen und füge Spalten aus beiden hinzu?

Mary-Kate Olsen
Mary-Kate OlsenOriginal
2024-11-02 12:43:03930Durchsuche

How to Merge DataFrames and Include Columns from Both?

DataFrames mit Spalteneinschluss zusammenführen

Beim Zusammenführen zweier DataFrames ist es üblich, Informationen aus dem ersten beizubehalten und gleichzeitig Daten aus dem zweiten zu integrieren. Lassen Sie uns untersuchen, wie Sie dies in Pandas erreichen können.

Stellen Sie sich das folgende Szenario vor:

  • DataFrame df1 enthält Altersinformationen für Einzelpersonen.
  • DataFrame df2 enthält Geschlechtsinformationen für Einzelpersonen .

Unser Ziel ist es, df1 mit Geschlechtsinformationen zu füllen und gleichzeitig Informationen für Personen beizubehalten, die nicht in df2 vorhanden sind.

Lösung

Methode 1: Verwendung der Zusammenführungsfunktion von Pandas mit Linksverknüpfung

<code class="python">df = df1.merge(df2[['Name', 'Sex']], on='Name', how='left')</code>

Dieser Zusammenführungsvorgang verbindet df1 in der Spalte „Name“ mit df2, wobei alle Zeilen von df1 erhalten bleiben (aufgrund der Linksverknüpfung) und die Werte in „Geschlecht“ aktualisiert werden, sofern verfügbar.

Methode 2: Verwendung der Kartenfunktion von Pandas

<code class="python">df1['Sex'] = df1['Name'].map(df2.set_index('Name')['Sex'])</code>

Dieser Ansatz verwendet die Kartenfunktion, um die Spalte „Name“ von df1 der Spalte „Geschlecht“ von df2 zuzuordnen, während Name als Index in df2 festgelegt wird. Dadurch werden Personen in beiden DataFrames effektiv abgeglichen und fehlende Werte mit NaN aufgefüllt.

Überlegungen

Wenn in df2 doppelte Namenswerte vorhanden sind, kann der Kartenansatz inkonsistente Ergebnisse liefern. Erwägen Sie in solchen Fällen die Deduplizierung von df2 oder die Verwendung einer wörterbuchbasierten Zuordnung.

Verwenden Sie die Zusammenführungsfunktion außerdem mit Vorsicht, wenn Name fehlende Werte enthält, da dadurch nicht übereinstimmende Zeilen entfernt werden. Wenn die Datenintegrität von entscheidender Bedeutung ist, behandeln Sie fehlende Werte vor dem Zusammenführen entsprechend.

Das obige ist der detaillierte Inhalt vonWie füge ich DataFrames zusammen und füge Spalten aus beiden hinzu?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn