>백엔드 개발 >파이썬 튜토리얼 >Pandas에서 그룹화된 합계를 새 열로 추가할 때 NaN 값을 방지하는 방법은 무엇입니까?

Pandas에서 그룹화된 합계를 새 열로 추가할 때 NaN 값을 방지하는 방법은 무엇입니까?

Barbara Streisand
Barbara Streisand원래의
2024-12-22 19:59:17632검색

How to Avoid NaN Values When Adding Grouped Sums as a New Column in Pandas?

그룹 합계에서 새 열 생성

문제

그룹별 합계 연산 결과를 DataFrame에 새 열을 생성하려고 할 때 pandas를 사용하면 일부 사용자는 새 열에서 NaN 값을 발견합니다. 주요 문제는 그룹별 합계를 개별 행에 할당하려고 할 때 발생합니다.

해결책

이 문제를 해결하는 핵심은 인덱스가 정렬된 시리즈를 반환하는 변환 함수를 사용하는 것입니다. DataFrame에. 변환을 사용하면 결과를 DataFrame에 새 열로 추가할 수 있습니다.

다음 코드 조각을 고려하세요.

import pandas as pd

df = pd.DataFrame({
    'Date': ['2015-05-08', '2015-05-07', '2015-05-06', '2015-05-05',
             '2015-05-08', '2015-05-07', '2015-05-06', '2015-05-05'],
    'Sym': ['aapl', 'aapl', 'aapl', 'aapl', 'aaww', 'aaww', 'aaww', 'aaww'],
    'Data2': [11, 8, 10, 15, 110, 60, 100, 40],
    'Data3': [5, 8, 6, 1, 50, 100, 60, 120]
})

df['Data4'] = df['Data3'].groupby(df['Date']).transform('sum')

print(df)

출력:

         Date   Sym  Data2  Data3  Data4
0  2015-05-08  aapl     11      5     55
1  2015-05-07  aapl      8      8    108
2  2015-05-06  aapl     10      6     66
3  2015-05-05  aapl     15      1    121
4  2015-05-08  aaww    110     50     55
5  2015-05-07  aaww     60    100    108
6  2015-05-06  aaww    100     60     66
7  2015-05-05  aaww     40    120    121

As 그림에 표시된 것처럼 새 열인 Data4의 각 행은 이제 해당 날짜 그룹에 대한 Data3 값의 합계를 반영하여 NaN의 초기 문제를 효과적으로 해결합니다. 가치가 있습니다.

위 내용은 Pandas에서 그룹화된 합계를 새 열로 추가할 때 NaN 값을 방지하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.