>백엔드 개발 >파이썬 튜토리얼 >GroupBy를 사용하여 여러 Pandas DataFrame 행의 문자열을 연결하는 방법은 무엇입니까?

GroupBy를 사용하여 여러 Pandas DataFrame 행의 문자열을 연결하는 방법은 무엇입니까?

Patricia Arquette
Patricia Arquette원래의
2024-12-14 14:05:13469검색

How to Concatenate Strings from Multiple Pandas DataFrame Rows using GroupBy?

Pandas GroupBy를 사용하여 여러 행의 문자열 연결

Pandas의 groupby를 사용하여 열에 있는 여러 행의 문자열을 연결하려면 다음을 활용할 수 있습니다. 그룹별 및 변환 기술의 조합.

다음 데이터세트를 고려하세요. "이름"과 "월"의 각 그룹에 대해 "text" 열을 연결하려고 합니다.

import pandas as pd
from io import StringIO

data = StringIO(
    "\n".join([
        '"name1","hej","2014-11-01"',
        '"name1","du","2014-11-02"',
        '"name1","aj","2014-12-01"',
        '"name1","oj","2014-12-02"',
        '"name2","fin","2014-11-01"',
        '"name2","katt","2014-11-02"',
        '"name2","mycket","2014-12-01"',
        '"name2","lite","2014-12-01"'
    ])
)

# Load and process the data
df = pd.read_csv(data, header=0, names=["name", "text", "date"], parse_dates=["date"])
df["month"] = df["date"].apply(lambda x: x.month)

"이름"과 "월"의 각 그룹에 대해 "text" 열을 연결하려면 다음을 수행합니다. 그룹별 기능을 사용할 수 있습니다:

df['text'] = df[['name','text','month']].groupby(['name','month'])['text'].transform(lambda x: ','.join(x))

또는 적용 기능을 사용하고 인덱스:

df.groupby(['name','month'])['text'].apply(','.join).reset_index()

이렇게 하면 각 그룹에 대해 "텍스트" 값이 연결되는 새 열이 생성됩니다.

    name  month         text
0  name1     11           du
1  name1     12        aj,oj
2  name2     11     fin,katt
3  name2     12  mycket,lite

그룹별 변환 기술을 활용하면 효율적으로 연결할 수 있습니다. 여러 행의 문자열을 분석하여 데이터 분석 및 표현을 향상합니다.

위 내용은 GroupBy를 사용하여 여러 Pandas DataFrame 행의 문자열을 연결하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.