Heim >Backend-Entwicklung >Python-Tutorial >Wie kann ich Textspalten in einem Pandas-DataFrame kombinieren, um eine neue Spalte zu erstellen?
Bei Pandas umfasst die Datenmanipulation häufig das Kombinieren von Spalten, um aussagekräftige Erkenntnisse abzuleiten. Ein solches Szenario entsteht, wenn wir Textspalten zusammenführen müssen, um eine neue Textspalte zu erstellen.
Betrachten Sie den folgenden Datenrahmen mit zwei Textspalten, „Jahr“ und „Quartal“:
Year quarter 2000 q2 2001 q3
Unser Ziel ist es, eine neue Spalte mit dem Namen „Periode“ zu erstellen, die die Spalten „Jahr“ und „Quartal“ kombiniert, um Werte wie „2000q2“ und zu erhalten „2001q3.“
Um dies zu erreichen, können wir die Spalten „Jahr“ und „Quartal“ direkt verketten, wenn beide Zeichenfolgen sind:
df["period"] = df["Year"].astype(str) + df["quarter"]
Allerdings, wenn eine oder beide Spalten keine Zeichenfolgen sind Wenn wir Zeichenfolgen verwenden, müssen wir sie vor der Verkettung in Zeichenfolgen konvertieren. Zum Beispiel:
df["period"] = df["Year"].astype(str) + df["quarter"]
Es ist wichtig, bei der Durchführung dieses Vorgangs auf NaN-Werte zu achten, da diese zu unbeabsichtigten Ergebnissen führen können.
Alternativ, wenn mehrere Zeichenfolgenspalten verbunden werden müssen, Die agg-Methode kann sich als nützlich erweisen:
df['period'] = df[['Year', 'quarter', ...]].agg('-'.join, axis=1)
In diesem Fall wird „-“ als Trennzeichen verwendet, Sie können es jedoch anpassen benötigt.
Das obige ist der detaillierte Inhalt vonWie kann ich Textspalten in einem Pandas-DataFrame kombinieren, um eine neue Spalte zu erstellen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!