Heim >Backend-Entwicklung >Python-Tutorial >Wie kann ich mithilfe von Groupby Zeichenfolgen aus mehreren Pandas DataFrame-Zeilen verketten?

Wie kann ich mithilfe von Groupby Zeichenfolgen aus mehreren Pandas DataFrame-Zeilen verketten?

Linda Hamilton
Linda HamiltonOriginal
2024-12-22 02:09:14313Durchsuche

How Can I Concatenate Strings from Multiple Pandas DataFrame Rows Using Groupby?

Verketten von Zeichenfolgen aus mehreren Zeilen mithilfe von Pandas Groupby

Im Bereich der Datenmanipulation mit Pandas ist es häufig erforderlich, Zeichenfolgen aus mehreren Zeilen zu kombinieren Zeilen basierend auf bestimmten Kriterien. Groupby-Operationen bieten eine leistungsstarke Möglichkeit, dies zu erreichen. Schauen wir uns ein praktisches Beispiel an.

Angenommen, wir haben einen DataFrame mit den Spalten „Name“, „Text“ und „Datum“. Wir möchten die „Text“-Einträge für jede eindeutige Kombination aus „Name“ und „Monat“ verketten. Um dies zu erreichen, können wir die folgenden Schritte verwenden:

  1. GroupBy und Transform: Gruppieren Sie den DataFrame nach den Spalten „Name“ und „Monat“. Wenden Sie dann die Transformationsoperation an und verwenden Sie eine Lambda-Funktion, um die „Text“-Einträge mit einem Kommatrennzeichen zu verbinden:

    df['text'] = df[['name','text','month']].groupby(['name','month'])['text'].transform(lambda x: ','.join(x))
  2. Duplikate entfernen: Das transformierte „ Die Spalte „Text“ kann doppelte Einträge enthalten. Um eindeutige Einträge beizubehalten, löschen Sie Duplikate basierend auf den Spalten „Name“ und „Monat“:

    df[['name','text','month']].drop_duplicates()

Alternativ können wir den Prozess vereinfachen, indem wir apply und reset_index verwenden, um das gewünschte zu erhalten Ausgabe:

df.groupby(['name','month'])['text'].apply(','.join).reset_index()

Diese Methoden ermöglichen eine effiziente Verkettung von Zeichenfolgen aus mehreren Zeilen in einem Pandas DataFrame, wodurch Datenmanipulationsaufgaben einfacher werden überschaubar.

Das obige ist der detaillierte Inhalt vonWie kann ich mithilfe von Groupby Zeichenfolgen aus mehreren Pandas DataFrame-Zeilen verketten?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn