Heim >Backend-Entwicklung >Python-Tutorial >Wie zähle ich die Häufigkeit identischer Zeilen in einem Pandas-DataFrame?
Erhalten Sie eine Häufigkeitszählung basierend auf mehreren Datenrahmenspalten
Um zu bestimmen, wie oft identische Zeilen in einem Datenrahmen erscheinen, können wir Groupby von Pandas verwenden Funktion. Betrachten Sie das folgende Beispiel:
data = {'Group': ['Short', 'Short', 'Moderate', 'Moderate', 'Tall'], 'Size': ['Small', 'Small', 'Medium', 'Small', 'Large']} df = pd.DataFrame(data)
Wir können die Häufigkeitsanzahl auf drei Arten berechnen:
Option 1:
dfg = df.groupby(by=["Group", "Size"]).size()
Dies ergibt eine Serie mit der folgenden Ausgabe:
Group Size Moderate Medium 1 Small 1 Short Small 2 Tall Large 1 dtype: int64
Option 2:
dfg = df.groupby(by=["Group", "Size"]).size().reset_index(name="Time")
Dies führt zu einem DataFrame mit einer hinzugefügten Spalte „Zeit“:
Group Size Time 0 Moderate Medium 1 1 Moderate Small 1 2 Short Small 2 3 Tall Large 1
Option 3:
dfg = df.groupby(by=["Group", "Size"], as_index=False).size()
Dies erzeugt auch einen DataFrame, der der Ausgabe von Option 2 entspricht.
Das obige ist der detaillierte Inhalt vonWie zähle ich die Häufigkeit identischer Zeilen in einem Pandas-DataFrame?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!