ホームページ >バックエンド開発 >Python チュートリアル >Pandas の同じ列に複数の集計を適用するにはどうすればよいですか?
パンダの同じ列に複数の集計を適用する
パンダでは、GroupBy.agg() は、複数の関数を実行する便利な方法を提供します。グループ化されたデータ。ただし、agg() を使用して同じ列に異なる関数を適用するのは、一見難しいように思えるかもしれません。
伝統的に、構文的には正しくありませんが望ましいアプローチは、agg() の辞書引数に重複キーを渡すことですが、これはそうではありません。
これに対処するために、pandas はいくつかのオプションを提供します。
オプション 1: リストof Tuples
2022 年 6 月 20 日現在、推奨される方法は、タプル [(column, function)] のリストを agg() に提供することです。各タプルは実行される集計を表します。指定された列。
df.groupby('dummy').agg( Mean=('returns', np.mean), Sum=('returns', np.sum))
オプション 2: ネストDictionary
もう 1 つのアプローチは、ネストされた辞書を使用することです。外側のキーが列で、内側の値が適用される関数です。
df.groupby('dummy').agg({'returns': {'Mean': np.mean, 'Sum': np.sum}})
オプション3: 関数のリスト
パンダの過去のバージョンの場合、代替オプションは関数をリストとして渡すことですagg() の辞書引数内で。
df.groupby('dummy').agg({'returns': [np.mean, np.sum]})
これらのオプションを利用すると、補助関数を使用したり、明示的に agg() を複数回呼び出したりすることなく、同じ列で複数の集計を簡単に実行できます。
以上がPandas の同じ列に複数の集計を適用するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。