Heim > Artikel > Backend-Entwicklung > Wie kann ich Zeilen zweier DataFrames in Pandas verketten, und gibt es alternative Methoden zum Kombinieren von DataFrames?
Verketten von Zeilen zweier Datenrahmen in Pandas: Eine Anleitung
Bei der Arbeit mit Daten in Pandas gibt es häufig Fälle, in denen dies erforderlich ist Kombinieren Sie Daten aus mehreren Quellen. Dies kann durch verschiedene Methoden erreicht werden, darunter die Verkettung. Die Verkettung ermöglicht die horizontale Ausrichtung und Zusammenführung von Datenrahmen und bietet eine umfassende Ansicht der Daten.
Verkettung von Zeilen zweier Datenrahmen
Der Prozess der Verkettung von Zeilen in zwei Datenrahmen , df_a und df_b, ist unkompliziert. Durch Aufrufen der Funktion concat und Angabe von axis=1 können Sie die Datenrahmen spaltenweise verketten, was zu einem Datenrahmen mit der gleichen Anzahl von Zeilen (nRow) wie df_a und df_b und einer Anzahl von Spalten führt, die der Summe der Zahlen entspricht von Spalten in beiden Datenrahmen.
Betrachten Sie das folgende Beispiel:
<code class="python">dict_data = {'Treatment': ['C', 'C', 'C'], 'Biorep': ['A', 'A', 'A'], 'Techrep': [1, 1, 1], 'AAseq': ['ELVISLIVES', 'ELVISLIVES', 'ELVISLIVES'], 'mz':[500.0, 500.5, 501.0]} df_a = pd.DataFrame(dict_data) dict_data = {'Treatment1': ['C', 'C', 'C'], 'Biorep1': ['A', 'A', 'A'], 'Techrep1': [1, 1, 1], 'AAseq1': ['ELVISLIVES', 'ELVISLIVES', 'ELVISLIVES'], 'inte1':[1100.0, 1050.0, 1010.0]} df_b = pd.DataFrame(dict_data)</code>
Um diese Datenrahmen horizontal zu verketten, würden Sie den folgenden Code verwenden:
<code class="python">pd.concat([df_a,df_b], axis=1)</code>
Das Ergebnis Der Datenrahmen hätte die folgende Struktur:
<code class="python"> AAseq Biorep Techrep Treatment mz AAseq1 Biorep1 Techrep1 \ 0 ELVISLIVES A 1 C 500.0 ELVISLIVES A 1 1 ELVISLIVES A 1 C 500.5 ELVISLIVES A 1 2 ELVISLIVES A 1 C 501.0 ELVISLIVES A 1 Treatment1 inte1 0 C 1100 1 C 1050 2 C 1010 </code>
Alternative Methoden
Zusätzlich zur Verkettung gibt es alternative Methoden, die zum Kombinieren von Datenrahmen verwendet werden können. Zu diesen Methoden gehören das Zusammenführen und Verbinden.
Zusammenführen
Das Zusammenführen von Datenrahmen kombiniert sie basierend auf einer bestimmten Spalte oder einem bestimmten Schlüssel. Dies ist nützlich, wenn die Datenrahmen eine gemeinsame Spalte haben und Sie die Daten basierend auf dieser Spalte kombinieren möchten. Für die oben angegebenen Datenrahmen df_a und df_b, die die gleiche Anzahl von Zeilen haben, können Sie sie mithilfe der Indizes wie folgt zusammenführen:
<code class="python">df_a.merge(df_b, left_index=True, right_index=True)</code>
Verbinden
Verbinden Datenrahmen ähneln dem Zusammenführen, aber anstatt die Datenrahmen basierend auf einer bestimmten Spalte zu kombinieren, werden die Datenrahmen basierend auf der Position der Zeilen zusammengefügt. Auch hier können Sie df_a und df_b, die die gleiche Anzahl an Zeilen und keine doppelten Indizes haben, wie folgt verbinden:
<code class="python">df_a.join(df_b)</code>
Die Wahl der zu verwendenden Methode hängt von den Anforderungen Ihrer jeweiligen Daten ab Analyseaufgabe. Verkettung, Zusammenführung und Zusammenführung bieten bequeme Möglichkeiten zum Kombinieren von Datenrahmen und bieten die Flexibilität, verschiedene Szenarien zu bewältigen.
Das obige ist der detaillierte Inhalt vonWie kann ich Zeilen zweier DataFrames in Pandas verketten, und gibt es alternative Methoden zum Kombinieren von DataFrames?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!