>백엔드 개발 >파이썬 튜토리얼 >구분 기호를 사용하여 Pandas GroupBy 그룹 내에서 값을 효율적으로 연결하려면 어떻게 해야 합니까?

구분 기호를 사용하여 Pandas GroupBy 그룹 내에서 값을 효율적으로 연결하려면 어떻게 해야 합니까?

Linda Hamilton
Linda Hamilton원래의
2024-12-04 22:28:141249검색

How Can I Efficiently Concatenate Values within Pandas GroupBy Groups Using a Delimiter?

구분자 조이너를 사용하는 Pandas GroupBy

Pandas에서 여러 값을 사용하여 데이터를 그룹화할 때 특정 구분 기호. 그러나 간단한 groupby 및 sum 작업으로 인해 원하는 구분 기호 없이 원하지 않는 출력이 발생할 수 있습니다.

다음 코드를 고려하세요.

import pandas as pd

df = pd.read_csv("Inputfile.txt", sep='\t')
group = df.groupby(['col'])['val'].sum()
# Output:
# A CatTiger
# B BallBat

이렇게 하면 연결된 값이 포함된 단일 문자열이 생성됩니다. 원하는 하이픈 구분 기호.

원하는 출력을 얻으려면 다음과 함께 적용 기능을 활용할 수 있습니다. Join:

group = df.groupby(['col'])['val'].sum().apply(lambda x: '-'.join(x))

그러나 이 솔루션은 각 값에 원치 않는 문자가 포함되어 있기 때문에 여전히 예상한 결과를 산출하지 못할 수 있습니다.

대체 솔루션

대신, 조인 매개변수와 함께 agg 함수를 사용하는 것을 고려해 보세요.

df.groupby('col')['val'].agg('-'.join)

이렇게 하면 올바르게 됩니다. 하이픈 구분 기호를 사용하여 그룹 내의 값을 연결하여 원하는 출력을 제공합니다.

col
A    Cat-Tiger
B     Ball-Bat
Name: val, dtype: object

솔루션 업데이트

MultiIndex 또는 Index 열을 처리하려면 인덱스를 재설정할 수 있습니다. 그리고 Reset_index 함수를 사용하여 이름을 바꾸세요.

df1 = df.groupby('col')['val'].agg('-'.join).reset_index(name='new')

이렇게 하면 인덱스가 새 열로 변환됩니다. 'new'라는 이름으로 그룹화된 데이터를 더욱 편리하게 작업할 수 있습니다.

위 내용은 구분 기호를 사용하여 Pandas GroupBy 그룹 내에서 값을 효율적으로 연결하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.