Heim >Backend-Entwicklung >Python-Tutorial >Wie gruppiere ich Pandas-Daten, zähle Vorkommen und finde die maximale Anzahl?

Wie gruppiere ich Pandas-Daten, zähle Vorkommen und finde die maximale Anzahl?

Mary-Kate OlsenOriginal: 2024-10-23 13:40:02868Durchsuche

How to Group Pandas Data, Count Occurrences, and Find Maximum Counts?

Pandas-Datengruppierungszählungen und Abruf der maximalen Anzahl

Problem:

Gegeben ist ein Pandas-Datenrahmen Wie können Sie bei mehreren Spalten Zeilen effizient nach zwei bestimmten Spalten gruppieren und die Anzahl in jeder Gruppe ermitteln? Wie bestimmen Sie außerdem die maximale Anzahl für jeden Wert in einer der Gruppierungsspalten?

Lösung:

So gruppieren Sie die DataFrame-Zeilen nach zwei Spalten und zählen Vorkommen , verwenden Sie die Funktion „groupby()“, gefolgt von der Methode „size()“:

<code class="python">df.groupby(['col5', 'col2']).size()</code>

Dieser Vorgang erstellt Gruppen basierend auf den angegebenen Spalten und gibt die Anzahl der Zeilen in jeder Gruppe zurück. Die Ausgabe ähnelt der folgenden:

col5  col2  count
1     A       1
      D       3
2     B       2
...

So ermitteln Sie die maximale Anzahl für jeden Wert in der Spalte „col2“:

<code class="python">df.groupby(['col5', 'col2']).size().groupby(level=1).max()</code>

Dieser Vorgang gruppiert die Zähldaten nach der Ebene der Spalte „col2“ und gibt die maximale Anzahl für jeden col2-Wert zurück und erzeugt eine Ausgabe wie:

Zusätzliche Hinweise:

Um nach mehreren Spalten zu gruppieren und Zählungen und zusätzliche zusammenfassende Statistiken zu erhalten , können Sie groupby() in Verbindung mit anderen Methoden wie agg() verwenden, wodurch Sie mehrere Aggregationsfunktionen angeben können:

<code class="python">df.groupby(['col5', 'col2']).agg(['count', 'mean', 'max'])</code>

Das obige ist der detaillierte Inhalt vonWie gruppiere ich Pandas-Daten, zähle Vorkommen und finde die maximale Anzahl?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

pandas count for function this column

Stellungnahme：

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Vorheriger Artikel：Wie kann der PyLint-Fehler „Import nicht möglich“ für Modulimporte in Unterverzeichnisse behoben werden?Nächster Artikel：Wie kann der PyLint-Fehler „Import nicht möglich“ für Modulimporte in Unterverzeichnisse behoben werden?

In Verbindung stehende Artikel

Mehr sehen