Heim >Backend-Entwicklung >Python-Tutorial >Wie gruppiere ich Pandas DataFrame-Zeilen und konvertiere Spaltenwerte in Listen?
So konvertieren Sie Datenrahmenzeilen in Listen in Pandas GroupBy
Beim Bearbeiten von Datenrahmen in Pandas kann es erforderlich sein, Daten in eine bestimmte umzuwandeln Format zur weiteren Analyse. Eine Möglichkeit, dies zu tun, besteht darin, Zeilen nach einer bestimmten Spalte zu gruppieren und Listen aus einer anderen Spalte innerhalb jeder Gruppe zu erstellen.
In diesem Szenario erhalten wir einen Datenrahmen mit zwei Spalten: „a“ (Spaltenname) und 'b' (Spaltenwerte). Die Aufgabe besteht darin, diesen Datenrahmen in einen neuen Datenrahmen umzuwandeln, in dem für jeden eindeutigen Wert in Spalte „a“ die entsprechenden Werte aus Spalte „b“ in einer Liste gruppiert sind.
Um dies zu erreichen:
df1 = df.groupby('a')['b'].apply(list).reset_index(name='new')
In diesem Code:
Das Endergebnis ist ein neuer Datenrahmen. df1, mit den eindeutigen Werten aus Spalte „a“ in der Spalte „a“ und den entsprechenden Listen aus Spalte „b“ in der Spalte „neu“.
Hier ist ein Beispiel zur Veranschaulichung:
Angesichts des folgenden Datenrahmens:
a | b |
---|---|
A | 1 |
A | 2 |
B | 5 |
B | 5 |
B | 4 |
C | 6 |
Durch Anwenden des oben genannten Codes wird dieser umgewandelt in:
a | new |
---|---|
A | [1, 2] |
B | [5, 5, 4] |
C | [6] |
Das obige ist der detaillierte Inhalt vonWie gruppiere ich Pandas DataFrame-Zeilen und konvertiere Spaltenwerte in Listen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!