>백엔드 개발 >파이썬 튜토리얼 >Pandas에서 `groupby().count()`와 `groupby().size()`의 차이점은 무엇입니까?

Pandas에서 `groupby().count()`와 `groupby().size()`의 차이점은 무엇입니까?

Linda Hamilton
Linda Hamilton원래의
2024-11-28 17:38:11708검색

What's the Difference Between `groupby().count()` and `groupby().size()` in Pandas?

Pandas의 크기와 개수의 구별 이해

데이터 조작 및 분석을 위한 강력한 Python 라이브러리인 Pandas는 다음과 같은 유연한 작업을 제공합니다. 카테고리별로 데이터를 그룹화합니다. 그룹화된 데이터로 작업할 때 개수와 크기 방법의 차이를 이해하는 것이 중요합니다.

질문: Pandas에서 groupby("x").count와 groupby("x").size를 구분하는 것은 무엇입니까? ? 크기는 단순히 null을 제외합니까?

답변:

개수와 크기의 차이는 NaN 값 처리에 있습니다.

  • size: NaN 값을 포함하여 기본적으로 각 관측치의 총 개수를 제공합니다. group.
  • count: NaN 값을 제외하여 각 그룹에 대해 null이 아닌 관측치의 수를 산출합니다.

예:

다음 팬더를 고려해보세요 DataFrame:

df = pd.DataFrame({'a':[0,0,1,2,2,2], 'b':[1,2,3,4,np.NaN,4], 'c':np.random.randn(6)})

'a'로 그룹화된 'b' 열의 개수 및 크기 방법 평가:

print(df.groupby(['a'])['b'].count())
print(df.groupby(['a'])['b'].size())

출력:

a
0    2
1    1
2    2
Name: b, dtype: int64

a
0    2
1    1
2    3
dtype: int64

분명히 카운트 방법은 그룹 4의 NaN 값을 제외합니다(여기서 'a'는 2) 사이즈 방법에는 포함되어 있습니다.

위 내용은 Pandas에서 `groupby().count()`와 `groupby().size()`의 차이점은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.