Maison >développement back-end >Tutoriel Python >Comment calculer le temps moyen par organisation et cluster dans Pandas ?

Comment calculer le temps moyen par organisation et cluster dans Pandas ?

Mary-Kate Olsen
Mary-Kate Olsenoriginal
2024-11-25 11:03:12578parcourir

How to Calculate the Average Time per Organization and Cluster in Pandas?

Calcul groupe par : moyenne du temps par organisation et cluster

Dans Pandas, calculer la moyenne du temps par organisation au sein de chaque cluster peut être réalisé en utilisant la fonction groupby().

1. Approche de regroupement imbriqué

Pour calculer la moyenne d'abord par ['cluster', 'org'] puis par 'cluster', utilisez le code suivant :

(df.groupby(['cluster', 'org'], as_index=False).mean()
    .groupby('cluster')['time'].mean())

2. Approche de regroupement à un seul niveau (cluster uniquement)

Pour calculer directement la moyenne des groupes de cluster, utilisez :

df.groupby(['cluster']).mean()

3. Regroupement par ['cluster', 'org'] et application de la moyenne

Une approche alternative consiste à regrouper par ['cluster', 'org'] puis à appliquer la fonction moyenne :

df.groupby(['cluster', 'org']).mean()

Résultat

Le résultat attendu pour toutes les approches est :

cluster mean(time)
1 15
2 54
3 6

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn