Maison >développement back-end >Tutoriel Python >Comment calculer la somme de colonnes spécifiques sur les lignes d'un Pandas DataFrame ?
Calcul de la somme des lignes dans un DataFrame pour des colonnes spécifiques
Pour adresser votre DataFrame, où vous souhaitez ajouter une colonne « e » représentant la somme des colonnes 'a', 'b' et 'd', l'opération appropriée utilisant les colonnes et le DataFrame spécifiés est la suivante :
df['e'] = df[['a', 'b', 'd']].sum(axis=1, numeric_only=True)
Ici, sum(axis=1) calcule la somme le long de chaque ligne, en ajoutant efficacement les valeurs des colonnes « a », « b » et « d » pour chaque ligne. Le paramètre numeric_only=True garantit que seules les colonnes numériques sont prises en compte, en ignorant les colonnes non numériques comme « c ».
Approche alternative : exclusion de colonnes spécifiques
Si vous le souhaitez pour exclure des colonnes de la somme, vous pouvez créer une liste des colonnes souhaitées et exclure celles indésirables :
col_list = list(df) col_list.remove('d') df['e'] = df[col_list].sum(axis=1)
Cette approche vous permet de sélectionner les colonnes spécifiques pour le calcul.
Remarques supplémentaires :
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!