>백엔드 개발 >파이썬 튜토리얼 >Pandas DataFrame 열에서 연속 값을 효율적으로 그룹화하려면 어떻게 해야 합니까?

Pandas DataFrame 열에서 연속 값을 효율적으로 그룹화하려면 어떻게 해야 합니까?

DDD
DDD원래의
2024-12-05 04:54:08447검색

How Can I Efficiently Group Consecutive Values in a Pandas DataFrame Column?

Pandas DataFrames에서 연속 값 그룹화

DataFrame에서는 함께 그룹화해야 하는 연속 값이 포함된 열을 만날 수 있습니다. 예를 들어 값이 포함된 다음 열을 고려해 보세요.

[1, 1, -1, 1, -1, -1]

이러한 값을 다음과 같은 원하는 그룹으로 효율적으로 그룹화하려면

[1,1] [-1] [1] [-1, -1]

Pandas 라이브러리를 사용하여 다음 단계를 따르세요.

Custom Series를 사용한 솔루션 그룹화

맞춤형 시리즈를 활용하여 이 그룹화를 달성할 수 있습니다. 접근 방식은 다음과 같습니다.

import pandas as pd

# Create sample DataFrame
df = pd.DataFrame({'a': [1, 1, -1, 1, -1, -1]})

# Use ne() and cumsum() to create grouping indicator
ind = df['a'].ne(df['a'].shift()).cumsum()

# Group by this indicator
for i, g in df.groupby(ind):
    # Print grouping key
    print(i)
    
    # Print rows in group
    print(g)
    
    # Convert values to list for display
    print(g.a.tolist())

이 코드는 원하는 그룹화 및 값을 출력합니다.

1
   a
0  1
1  1
[1, 1]
2
   a
2 -1
[-1]
3
   a
3  1
[1]
4
   a
4 -1
5 -1
[-1, -1]

위 내용은 Pandas DataFrame 열에서 연속 값을 효율적으로 그룹화하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.