Heim >Backend-Entwicklung >Python-Tutorial >Wie füge ich gruppierten Pandas-DataFrames effizient eine sequentielle Zählerspalte hinzu?

Wie füge ich gruppierten Pandas-DataFrames effizient eine sequentielle Zählerspalte hinzu?

Linda Hamilton
Linda HamiltonOriginal
2024-12-17 05:06:24132Durchsuche

How to Efficiently Add a Sequential Counter Column to Grouped Pandas DataFrames?

Fügen Sie eine sequentielle Zählerspalte für Gruppen zu einem Pandas-DataFrame ohne Rückruf hinzu

In der Pandas-Bibliothek können effizientere Methoden als verwendet werden Rückruffunktionen zum Hinzufügen sequentieller Zählerspalten zu gruppierten Datenrahmen. Die Funktion cumcount() bietet einen alternativen Ansatz. So implementieren Sie es:

import pandas as pd

df = pd.DataFrame(
    columns="   index    c1    c2    v1 ".split(),
    data=[
        [0, "A", "X", 3],
        [1, "A", "X", 5],
        [2, "A", "Y", 7],
        [3, "A", "Y", 1],
        [4, "B", "X", 3],
        [5, "B", "X", 1],
        [6, "B", "X", 3],
        [7, "B", "Y", 1],
        [8, "C", "X", 7],
        [9, "C", "Y", 4],
        [10, "C", "Y", 1],
        [11, "C", "Y", 6],
    ],
).set_index("index", drop=True)

# Add a sequential counter column
df["seq"] = df.groupby(["c1", "c2"]).cumcount() + 1
print(df)

Dieses Code-Snippet gruppiert den Datenrahmen nach „c1“ und „c2“ und wendet dann die Funktion „cumcount()“ auf jede Gruppe an, um die Zeilen innerhalb dieser Gruppe zu zählen. Das Ergebnis ist ein Datenrahmen mit einer zusätzlichen „seq“-Spalte, die die sequentiellen Zählungen für jede Gruppe enthält:

   c1 c2  v1  seq
0   A  X   3    1
1   A  X   5    2
2   A  Y   7    1
3   A  Y   1    2
4   B  X   3    1
5   B  X   1    2
6   B  X   3    3
7   B  Y   1    1
8   C  X   7    1
9   C  Y   4    1
10  C  Y   1    2
11  C  Y   6    3

Dieser Ansatz macht Callback-Funktionen überflüssig und bietet eine präzisere und effizientere Lösung zum Hinzufügen sequentieller Zählerspalten zu gruppierten Pandas-Datenrahmen.

Das obige ist der detaillierte Inhalt vonWie füge ich gruppierten Pandas-DataFrames effizient eine sequentielle Zählerspalte hinzu?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn