ホームページ >バックエンド開発 >Python チュートリアル >Pandas で複数のグループ内の平均値を計算するにはどうすればよいですか?
cluster org time 1 a 8 1 a 6 2 h 34 1 c 23 2 d 74 3 w 6各クラスタ内の組織ごとの時間の平均を計算するには、クラスターと組織の両方で DataFrame をグループ化できます:
df.groupby(['cluster', 'org'], as_index=False).mean()これにより、クラスターと組織でグループ化された DataFrame が生成されます。各グループに対して計算された時間の平均:
cluster org time 0 1 a 12.333333 1 1 c 23.0 2 2 h 34.0 3 2 d 74.0 4 3 w 6.0各クラスター内の時間の平均だけが必要な場合は、クラスターのみでグループ化できます:
df.groupby('cluster').mean()これにより、DataFrame が生成されます各クラスターに対して計算された時間の平均を使用します:
cluster time 0 1 12.333333 1 2 54.0 2 3 6.0または、複数列の組み合わせに対して groupby メソッドを使用することもできます。 ['cluster', 'org'] そして時間の平均を計算します:
df.groupby(['cluster', 'org']).mean()['time']これにより、クラスターと組織の組み合わせごとに計算された時間の平均を持つシリーズが生成されます。
以上がPandas で複数のグループ内の平均値を計算するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。