Heim > Artikel > Backend-Entwicklung > Wie berechne ich die Zeilensumme bestimmter Spalten in einem Pandas DataFrame?
Zeilensummierung gegebener Spalten in Pandas DataFrame
In der Pandas-Bibliothek von Python müssen wir häufig die Summe bestimmter Spalten berechnen ein DataFrame. Um dies effektiv zu erreichen, müssen wir die entsprechenden Parameter und Operationen berücksichtigen.
Betrachten wir den folgenden DataFrame:
df = pd.DataFrame({'a': [1, 2, 3], 'b': [2, 3, 4], 'c': ['dd', 'ee', 'ff'], 'd': [5, 9, 1]})
Unser Ziel ist es, eine Spalte „e“ hinzuzufügen, die die Summe von darstellt Spalten „a“, „b“ und „d“. Obwohl es intuitiv ist, könnte man dies mit etwas angehen wie:
df['e'] = df[['a', 'b', 'd']].map(sum)
Diese Methode liefert nicht die gewünschte Ausgabe.
Der richtige Ansatz besteht darin, die Funktion sum() mit den folgenden Parametern zu verwenden:
df['e'] = df.sum(axis=1, numeric_only=True)Ausgabe:
a b c d e 0 1 2 dd 5 8 1 2 3 ee 9 14 2 3 4 ff 1 8Durch die Verwendung dieser Operationen, Wir können Zeilen für bestimmte Spalten in einem Pandas DataFrame effektiv summieren und so eine genaue und effiziente Datenanalyse gewährleisten.
col_list = list(df) col_list.remove('d') df['e'] = df[col_list].sum(axis=1)
Das obige ist der detaillierte Inhalt vonWie berechne ich die Zeilensumme bestimmter Spalten in einem Pandas DataFrame?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!