Heim >Backend-Entwicklung >Python-Tutorial >Wie gruppiere ich Pandas-Daten, zähle Vorkommen und finde die maximale Anzahl?
Pandas-Datengruppierungszählungen und Abruf der maximalen Anzahl
Problem:
Gegeben ist ein Pandas-Datenrahmen Wie können Sie bei mehreren Spalten Zeilen effizient nach zwei bestimmten Spalten gruppieren und die Anzahl in jeder Gruppe ermitteln? Wie bestimmen Sie außerdem die maximale Anzahl für jeden Wert in einer der Gruppierungsspalten?
Lösung:
So gruppieren Sie die DataFrame-Zeilen nach zwei Spalten und zählen Vorkommen , verwenden Sie die Funktion „groupby()“, gefolgt von der Methode „size()“:
<code class="python">df.groupby(['col5', 'col2']).size()</code>
Dieser Vorgang erstellt Gruppen basierend auf den angegebenen Spalten und gibt die Anzahl der Zeilen in jeder Gruppe zurück. Die Ausgabe ähnelt der folgenden:
col5 col2 count 1 A 1 D 3 2 B 2 ...
So ermitteln Sie die maximale Anzahl für jeden Wert in der Spalte „col2“:
<code class="python">df.groupby(['col5', 'col2']).size().groupby(level=1).max()</code>
Dieser Vorgang gruppiert die Zähldaten nach der Ebene der Spalte „col2“ und gibt die maximale Anzahl für jeden col2-Wert zurück und erzeugt eine Ausgabe wie:
col2 A 3 B 2 C 1 D 3
Zusätzliche Hinweise:
Um nach mehreren Spalten zu gruppieren und Zählungen und zusätzliche zusammenfassende Statistiken zu erhalten , können Sie groupby() in Verbindung mit anderen Methoden wie agg() verwenden, wodurch Sie mehrere Aggregationsfunktionen angeben können:
<code class="python">df.groupby(['col5', 'col2']).agg(['count', 'mean', 'max'])</code>
Das obige ist der detaillierte Inhalt vonWie gruppiere ich Pandas-Daten, zähle Vorkommen und finde die maximale Anzahl?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!