Pandas에서 데이터 그룹화 및 합산
데이터 분석에서는 의미 있는 통찰력을 도출하기 위해 특정 기준에 따라 데이터를 집계해야 하는 경우가 많습니다. 데이터 조작을 위한 강력한 Python 라이브러리인 Pandas는 하나 이상의 열을 기반으로 데이터를 그룹화하는 groupby() 메서드를 제공합니다. 이 방법을 sum()과 같은 집계 함수와 결합하여 각 그룹의 집계 값을 계산할 수 있습니다.
그룹별 값 합계 계산
개인의 과일 소비에 대한 정보가 포함된 DataFrame이 있습니다. 각 행은 과일 종류, 구매 날짜, 고객 이름, 구매한 과일 개수 등 과일 구매를 나타냅니다.
과일 종류와 고객 이름을 기준으로 그룹화하여 각 개인이 구매한 총 과일 개수를 계산합니다. , 다음 단계를 사용할 수 있습니다.
1단계: 데이터 그룹화
먼저, DataFrame을 두 가지 기준으로 그룹화합니다. groupby() 메서드를 사용하여 'Fruit' 및 'Name' 열:
df_grouped = df.groupby(['Fruit', 'Name'])
이렇게 하면 그룹화된 데이터를 나타내는 SeriesGroupBy 개체가 생성됩니다.
2단계: 적용 Sum 함수
각 그룹이 구매한 총 과일 수를 계산하기 위해 sum() 함수를 적용합니다. 그룹화된 시리즈:
df_grouped_sum = df_grouped['Number'].sum()
결과 시리즈인 df_grouped_sum에는 과일 유형과 고객 이름의 각 고유 조합에 대한 과일 구매 합계가 포함됩니다.
예
다음을 고려하세요 DataFrame:
Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1 Grapes 10/7/2016 Bob 1 Grapes 10/7/2016 Tom 87 Grapes 10/7/2016 Bob 22 Grapes 10/7/2016 Bob 12 Grapes 10/7/2016 Tony 15
이 DataFrame에 groupby() 및 sum() 작업을 적용하면 다음과 같은 결과를 얻습니다.
Number Fruit Name Apples Bob 16 Mike 9 Steve 10 Grapes Bob 35 Tom 87 Tony 15 Oranges Bob 67 Mike 57 Tom 15 Tony 1
이 출력은 다음에서 구매한 총 과일 수를 보여줍니다. 각 개체를 과일 종류별로 분류합니다.
위 내용은 고객 및 과일 유형별 총 구매를 계산하기 위해 Pandas에서 데이터를 그룹화하고 합산하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!