Heim >Backend-Entwicklung >Python-Tutorial >Wie wende ich mehrere Funktionen auf mehrere Spalten in Pandas GroupBy an?

Wie wende ich mehrere Funktionen auf mehrere Spalten in Pandas GroupBy an?

Barbara Streisand
Barbara StreisandOriginal
2024-12-08 05:53:10543Durchsuche

How to Apply Multiple Functions to Multiple Columns in Pandas GroupBy?

So wenden Sie mehrere Funktionen auf mehrere gruppierte Spalten an

Groupby-Operationen in Pandas ermöglichen die Aggregation von Daten basierend auf bestimmten Spalten oder Schlüsseln. Bei der Arbeit mit komplexen Datensätzen kann es jedoch erforderlich sein, mehrere Vorgänge für verschiedene Spalten innerhalb der gruppierten Daten durchzuführen.

Verwenden eines Wörterbuchs für Reihengruppierungen

Für ein Series-Groupby-Objekt können Sie ein Wörterbuch verwenden, um mehrere Funktionen und Ausgabespaltennamen anzugeben, wie unten gezeigt:

grouped['D'].agg({'result1' : np.sum,
   .....:                   'result2' : np.mean})

Bei diesem Ansatz ist dies jedoch nicht der Fall funktioniert für DataFrame-Gruppierungsobjekte, da erwartet wird, dass die Wörterbuchschlüssel Spaltennamen zum Anwenden von Funktionen darstellen.

Benutzerdefinierte Funktionen mit Apply

Um diese Einschränkung zu beheben, können Sie Folgendes nutzen die apply-Methode, die implizit einen DataFrame an die angewendete Funktion übergibt. Indem Sie eine benutzerdefinierte Funktion definieren und eine Serie oder MultiIndex-Serie zurückgeben, können Sie mehrere Vorgänge für mehrere Spalten innerhalb jeder Gruppe ausführen:

Eine Serie zurückgeben:

def f(x):
    d = {}
    d['a_sum'] = x['a'].sum()
    d['a_max'] = x['a'].max()
    d['b_mean'] = x['b'].mean()
    d['c_d_prodsum'] = (x['c'] * x['d']).sum()
    return pd.Series(d, index=['a_sum', 'a_max', 'b_mean', 'c_d_prodsum'])

df.groupby('group').apply(f)

Eine Serie mit MultiIndex zurückgeben:

def f_mi(x):
        d = []
        d.append(x['a'].sum())
        d.append(x['a'].max())
        d.append(x['b'].mean())
        d.append((x['c'] * x['d']).sum())
        return pd.Series(d, index=[['a', 'a', 'b', 'c_d'], 
                                   ['sum', 'max', 'mean', 'prodsum']])

df.groupby('group').apply(f_mi)

Dieser Ansatz bietet eine flexible Möglichkeit, komplexe Aggregationen durchzuführen gruppierte Daten, was mehrere Vorgänge für mehrere Spalten innerhalb jeder Gruppe ermöglicht.

Das obige ist der detaillierte Inhalt vonWie wende ich mehrere Funktionen auf mehrere Spalten in Pandas GroupBy an?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn