Pandas Group-By: 이름으로 과일 총계 결정
데이터 조작 시나리오에서는 지정된 기준에 따라 데이터를 집계해야 하는 경우가 종종 발생합니다. . Pandas의 그룹별 방법은 데이터를 그룹화하고 다양한 집계를 수행하기 위한 강력한 솔루션을 제공합니다. 이 기사에서는 groupby를 사용하여 주어진 데이터 세트의 각 이름에 대한 과일의 합을 계산하는 방법을 보여줍니다.
문제 설명:
과일을 나타내는 열이 있는 데이터 프레임이 주어졌습니다. , 날짜, 이름 및 숫자:
import pandas as pd df = pd.DataFrame({ 'Fruit': ['Apples', 'Apples', 'Apples', 'Apples', 'Apples', 'Oranges', 'Oranges', 'Oranges', 'Oranges', 'Oranges', 'Grapes', 'Grapes', 'Grapes', 'Grapes', 'Grapes'], 'Date': ['10/6/2016', '10/6/2016', '10/6/2016', '10/7/2016', '10/7/2016', '10/7/2016', '10/6/2016', '10/6/2016', '10/6/2016', '10/7/2016', '10/7/2016', '10/7/2016', '10/7/2016', '10/7/2016', '10/7/2016'], 'Name': ['Bob', 'Bob', 'Mike', 'Steve', 'Bob', 'Bob', 'Tom', 'Mike', 'Bob', 'Tony', 'Bob', 'Tom', 'Bob', 'Bob', 'Tony'], 'Number': [7, 8, 9, 10, 1, 2, 15, 57, 65, 1, 1, 87, 22, 12, 15] })
해결책:
각 이름에 대한 과일의 합을 계산하려면 다음 단계를 따르세요.
result_df = df.groupby(['Fruit', 'Name'])['Number'].sum()
이 작업 'Fruit' 및 'Name' 열을 기준으로 데이터를 그룹화하고 합계를 계산하여 'Number' 열을 집계합니다. 출력은 '과일'과 '이름'의 각 조합에 대한 총 과일 수를 포함하는 데이터 프레임이 됩니다.
결과:
결과 데이터 프레임은 다음과 유사합니다. 다음:
Number Fruit Name Apples Bob 16 Mike 9 Steve 10 Grapes Bob 35 Tom 87 Tony 15 Oranges Bob 67 Mike 57 Tom 15 Tony 1
집계를 위해 특정 열을 지정해야 하는 경우 다음 구문을 사용할 수 있습니다. 사용됨:
result_df = df.groupby(['Name', 'Fruit'])['Number'].sum()
Pandas의 groupby 및 sum 기능을 사용하면 데이터를 효과적으로 그룹화하고 집계하여 대규모 데이터 세트에서 의미 있는 통찰력을 얻을 수 있으므로 데이터 탐색 및 분석을 위한 강력한 도구가 됩니다.
위 내용은 Pandas GroupBy는 이름당 총 과일 수를 어떻게 계산할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!