Heim >Backend-Entwicklung >Python-Tutorial >Wie berechnet man die durchschnittliche Zeit pro Organisation und Cluster in Pandas?

Wie berechnet man die durchschnittliche Zeit pro Organisation und Cluster in Pandas?

Mary-Kate Olsen
Mary-Kate OlsenOriginal
2024-11-25 11:03:12601Durchsuche

How to Calculate the Average Time per Organization and Cluster in Pandas?

Gruppenweise Berechnung: Durchschnittliche Zeit pro Organisation und Cluster

In Pandas kann die durchschnittliche Zeit pro Organisation innerhalb jedes Clusters berechnet werden kann mit der Funktion groupby() erreicht werden.

1. Verschachtelter Gruppierungsansatz

Um den Durchschnitt zuerst nach ['cluster', 'org'] und dann nach 'cluster' zu berechnen, verwenden Sie den folgenden Code:

(df.groupby(['cluster', 'org'], as_index=False).mean()
    .groupby('cluster')['time'].mean())

2. Einstufiger Gruppierungsansatz (nur Cluster)

Um den Mittelwert von Clustergruppen direkt zu berechnen, verwenden Sie:

df.groupby(['cluster']).mean()

3. Gruppieren nach ['cluster', 'org'] und Anwenden des Mittelwerts

Ein alternativer Ansatz besteht darin, nach ['cluster', 'org'] zu gruppieren und dann die Mittelwertfunktion anzuwenden:

df.groupby(['cluster', 'org']).mean()

Ergebnis

Das erwartete Ergebnis für alle Ansätze ist:

cluster mean(time)
1 15
2 54
3 6

Das obige ist der detaillierte Inhalt vonWie berechnet man die durchschnittliche Zeit pro Organisation und Cluster in Pandas?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn