ホームページ >バックエンド開発 >Python チュートリアル >Pandas GroupBy を使用して名前ごとに果物の合計購入数を計算するにはどうすればよいですか?
Pandas Group-By Sum を使用した名前によるフルーツの合計の計算
データを操作する場合、グループ化と集計は不可欠な操作です。 Pandas は、これらのプロセスを簡素化する強力な GroupBy 関数を提供します。
各名前ごとに購入されたフルーツの総数を計算する次の DataFrame を考えてみましょう:
Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1 Grapes 10/7/2016 Bob 1 Grapes 10/7/2016 Tom 87 Grapes 10/7/2016 Bob 22 Grapes 10/7/2016 Bob 12 Grapes 10/7/2016 Tony 15
これを実現するには、次のようにします。 GroupBy 関数を使用して、「名前」と「フルーツ」の両方で DataFrame をグループ化できます:
df.groupby(['Name', 'Fruit'])
ただし、これは、集計を実行せずにデータをグループ化するだけです。各グループの「数値」の合計を計算するには、sum():
df.groupby(['Name', 'Fruit']).sum()
を使用できます。これにより、階層インデックスを持つ新しいデータフレームが出力されます。最初のレベルは「名前」に対応し、 2 番目のレベルは「フルーツ」に対応します。 「番号」列には、各グループの合計が含まれています:
Number Name Fruit Bob Apples 16 Grapes 35 Oranges 67 Mike Apples 9 Oranges 57 Steve Apples 10 Tom Grapes 87 Oranges 15 Tony Grapes 15 Oranges 1
これにより、各名前が購入した果物の合計数が示され、望ましい結果が得られます。
以上がPandas GroupBy を使用して名前ごとに果物の合計購入数を計算するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。