>백엔드 개발 >파이썬 튜토리얼 >사용자 정의 저장소를 사용하여 Pandas 열을 분류하고 값 개수를 얻으려면 어떻게 해야 합니까?

사용자 정의 저장소를 사용하여 Pandas 열을 분류하고 값 개수를 얻으려면 어떻게 해야 합니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-12-12 22:59:15973검색

How Can I Bin a Pandas Column with Custom Bins and Get Value Counts?

맞춤형 Bin 및 값 개수로 Pandas 열 Binning

숫자 데이터로 작업할 때 값을 Bin으로 그룹화하는 것이 유용한 경우가 많습니다. 패턴이나 추세를 감지합니다. 비닝이라고 하는 이 프로세스는 pandas 라이브러리를 사용하여 쉽게 수행할 수 있습니다.

열을 비닝하려면 pandas.cut 함수를 사용할 수 있습니다. 제공하신 예제의 작동 방식은 다음과 같습니다.

bins = [0, 1, 5, 10, 25, 50, 100]
df['binned'] = pd.cut(df['percentage'], bins)

이 코드는 DataFrame에 binned라는 새 열을 생성합니다. 이 열의 각 값은 백분율 열의 해당 숫자 값이 속하는 구간을 나타냅니다. bins 매개변수는 bin의 경계를 지정합니다.

bin 전체의 값 분포를 시각화하려면 value_counts 함수를 사용할 수 있습니다.

df['binned'].value_counts()

이 코드는 발생 횟수를 반환합니다. 각 bin의 값 개수를 효과적으로 제공합니다.

예를 들어 다음과 같은 경우 data:

df['percentage'].head()
46.5
44.2
100.0
42.12

다음 bin을 사용합니다.

bins = [0, 1, 5, 10, 25, 50, 100]

df['binned'].value_counts()의 출력은 다음과 같습니다.

(25, 50]     3
(50, 100]    1

이는 세 개의 값이 bin(25, 50]에 속하고 하나의 값이 bin(50, 100].

위 내용은 사용자 정의 저장소를 사용하여 Pandas 열을 분류하고 값 개수를 얻으려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.