Heim  >  Artikel  >  Backend-Entwicklung  >  Wie zähle ich die Häufigkeit identischer Zeilen in einem Pandas-DataFrame?

Wie zähle ich die Häufigkeit identischer Zeilen in einem Pandas-DataFrame?

Barbara Streisand
Barbara StreisandOriginal
2024-10-25 08:01:02466Durchsuche

How to Count the Frequency of Identical Rows in a Pandas DataFrame?

Erhalten Sie eine Häufigkeitszählung basierend auf mehreren Datenrahmenspalten

Um zu bestimmen, wie oft identische Zeilen in einem Datenrahmen erscheinen, können wir Groupby von Pandas verwenden Funktion. Betrachten Sie das folgende Beispiel:

data = {'Group': ['Short', 'Short', 'Moderate', 'Moderate', 'Tall'], 'Size': ['Small', 'Small', 'Medium', 'Small', 'Large']}
df = pd.DataFrame(data)

Wir können die Häufigkeitsanzahl auf drei Arten berechnen:

Option 1:

dfg = df.groupby(by=["Group", "Size"]).size()

Dies ergibt eine Serie mit der folgenden Ausgabe:

Group     Size
Moderate  Medium    1
          Small     1
Short     Small     2
Tall      Large     1
dtype: int64

Option 2:

dfg = df.groupby(by=["Group", "Size"]).size().reset_index(name="Time")

Dies führt zu einem DataFrame mit einer hinzugefügten Spalte „Zeit“:

      Group    Size  Time
0  Moderate  Medium     1
1  Moderate   Small     1
2     Short   Small     2
3      Tall   Large     1

Option 3:

dfg = df.groupby(by=["Group", "Size"], as_index=False).size()

Dies erzeugt auch einen DataFrame, der der Ausgabe von Option 2 entspricht.

Das obige ist der detaillierte Inhalt vonWie zähle ich die Häufigkeit identischer Zeilen in einem Pandas-DataFrame?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn