Heim >Backend-Entwicklung >Python-Tutorial >Wie kann ich mithilfe von Groupby Zeichenfolgen aus mehreren Pandas DataFrame-Zeilen verketten?
Verketten von Zeichenfolgen aus mehreren Zeilen mithilfe von Pandas Groupby
Im Bereich der Datenmanipulation mit Pandas ist es häufig erforderlich, Zeichenfolgen aus mehreren Zeilen zu kombinieren Zeilen basierend auf bestimmten Kriterien. Groupby-Operationen bieten eine leistungsstarke Möglichkeit, dies zu erreichen. Schauen wir uns ein praktisches Beispiel an.
Angenommen, wir haben einen DataFrame mit den Spalten „Name“, „Text“ und „Datum“. Wir möchten die „Text“-Einträge für jede eindeutige Kombination aus „Name“ und „Monat“ verketten. Um dies zu erreichen, können wir die folgenden Schritte verwenden:
GroupBy und Transform: Gruppieren Sie den DataFrame nach den Spalten „Name“ und „Monat“. Wenden Sie dann die Transformationsoperation an und verwenden Sie eine Lambda-Funktion, um die „Text“-Einträge mit einem Kommatrennzeichen zu verbinden:
df['text'] = df[['name','text','month']].groupby(['name','month'])['text'].transform(lambda x: ','.join(x))
Duplikate entfernen: Das transformierte „ Die Spalte „Text“ kann doppelte Einträge enthalten. Um eindeutige Einträge beizubehalten, löschen Sie Duplikate basierend auf den Spalten „Name“ und „Monat“:
df[['name','text','month']].drop_duplicates()
Alternativ können wir den Prozess vereinfachen, indem wir apply und reset_index verwenden, um das gewünschte zu erhalten Ausgabe:
df.groupby(['name','month'])['text'].apply(','.join).reset_index()
Diese Methoden ermöglichen eine effiziente Verkettung von Zeichenfolgen aus mehreren Zeilen in einem Pandas DataFrame, wodurch Datenmanipulationsaufgaben einfacher werden überschaubar.
Das obige ist der detaillierte Inhalt vonWie kann ich mithilfe von Groupby Zeichenfolgen aus mehreren Pandas DataFrame-Zeilen verketten?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!