Heim >Backend-Entwicklung >Python-Tutorial >Wie füge ich Pandas DataFrame-Gruppen effizient eine sequentielle Zählerspalte hinzu?
Fügen Sie eine sequentielle Zählerspalte für Gruppen zu einem Pandas-Datenrahmen ohne Rückruf hinzu
Der bereitgestellte Python-Code zeigt eine Möglichkeit, einen sequentiellen Zähler hinzuzufügen Spalte (seq) in einen Datenrahmen einfügen, indem Groupby-Operationen entlang bestimmter Spalten ('c1' und 'c2') ausgeführt und eine benutzerdefinierte Funktion angewendet werden. Möglicherweise gibt es jedoch einen effizienteren Ansatz, um dieses Ergebnis ohne die Notwendigkeit eines Rückrufs zu erzielen.
Eine Alternative besteht darin, die Funktion cumcount() zu verwenden, die eine bequeme Möglichkeit bietet, fortlaufende Zahlen innerhalb von Gruppen zu generieren. Hier ist eine verbesserte Lösung:
df['seq'] = df.groupby(['c1', 'c2']).cumcount() + 1
Diese Zeile fügt dem Datenrahmen eine neue Spalte mit dem Namen „seq“ hinzu, die fortlaufende Nummern für jede durch die Spalten „c1“ und „c2“ definierte Gruppe enthält. Die Funktion cumcount() wird entlang der angegebenen Gruppen angewendet und das Ergebnis wird um 1 verschoben, um die Zählung bei 1 statt bei 0 zu beginnen.
Hier ist die Ausgabe des geänderten Datenrahmens:
c1 c2 v1 seq 0 A X 3 1 1 A X 5 2 2 A Y 7 1 3 A Y 1 2 4 B X 3 1 5 B X 1 2 6 B X 3 3 7 B Y 1 1 8 C X 7 1 9 C Y 4 1 10 C Y 1 2 11 C Y 6 3
Durch die Verwendung von cumcount() wird die sequentielle Zählerspalte direkt zum ursprünglichen Datenrahmen hinzugefügt, wodurch die Notwendigkeit einer Rückruffunktion entfällt und der Code vereinfacht wird.
Das obige ist der detaillierte Inhalt vonWie füge ich Pandas DataFrame-Gruppen effizient eine sequentielle Zählerspalte hinzu?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!