Heim >Backend-Entwicklung >Python-Tutorial >Wie kann ich Textspalten in einem Pandas-DataFrame effizient verketten?
Im Bereich der Datenmanipulation besteht häufig die Notwendigkeit, mehrere Textspalten in einer einzigen, zusammenhängenden Spalte zu kombinieren. Lassen Sie uns ein häufiges Szenario mit einem DataFrame mit den Spalten „Jahr“ und „Quartal“ untersuchen, wobei das Ziel darin besteht, eine neue Spalte „Zeitraum“ zu erstellen, die die kombinierten Werte darstellt.
Um dies zu erreichen, wenden wir die folgenden Strategien an :
Direkte Verkettung (String-Spalten)
Wenn sowohl die Spalten „Jahr“ als auch „Quartal“ vorhanden sind vom Typ String können wir sie direkt verketten mit:
df["period"] = df["Year"] + df["quarter"]
Typkonvertierung (Spalten ohne String)
Wenn eine der Spalten nicht vom Typ String ist, wir müssen sie zuerst in Strings umwandeln:
df["period"] = df["Year"].astype(str) + df["quarter"]
Achtung: Gehen Sie dabei vorsichtig mit NaNs um Verkettung.
Aggregation für mehrere String-Spalten
Beim Umgang mit mehreren String-Spalten können wir die Funktion „agg“ verwenden:
df['period'] = df[['Year', 'quarter', ...]].agg('-'.join, axis=1)
Hier dient „-“ als Trennzeichen zwischen den Spaltenwerten.
Durch den Einsatz dieser Techniken können Sie Textspalten in Ihrem Text mühelos kombinieren Pandas DataFrame ebnet den Weg für eine nahtlose Datenverarbeitung und -analyse.
Das obige ist der detaillierte Inhalt vonWie kann ich Textspalten in einem Pandas-DataFrame effizient verketten?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!