>백엔드 개발 >파이썬 튜토리얼 >Pandas DataFrame 열을 여러 행으로 분해하는 방법은 무엇입니까?

Pandas DataFrame 열을 여러 행으로 분해하는 방법은 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2024-12-25 09:46:16599검색

How to Explode a Pandas DataFrame Column into Multiple Rows?

Pandas DataFrame의 열을 여러 행으로 중첩 해제(분해)하는 방법

Pandas에서 열을 폭발하려면 데이터를 단일 행에서 여러 행으로 변환해야 합니다. . 이는 목록 유형 셀이 포함된 열이 있고 이를 개별 행으로 분할해야 할 때 유용합니다.

목록이 포함된 'B' 열이 있는 DataFrame을 고려해 보세요.

df = pd.DataFrame({'A': [1, 2], 'B': [[1, 2], [1, 2]]})

Output:

   A       B
0  1  [1, 2]
1  2  [1, 2]

이 열 'B'를 분해하면 다양한 방법을 제시합니다.

방법 0 [Pandas >= 0.25]
Pandas 0.25부터 열 하나만 분해해야 하는 경우 pandas.DataFrame.explode 함수를 사용하세요.

df.explode('B')

Output:

   A  B
0  1  1
1  1  2
3  2  1
4  2  2

방법 1
pd.Series 적용 (이해하기 쉽지만 그렇지 않음 성능을 위해 권장됨):

df.set_index('A').B.apply(pd.Series).stack().reset_index(level=0).rename(columns={0:'B'})

방법 2
DataFrame 생성자와 함께 반복 사용:

df = pd.DataFrame({'A': df.A.repeat(df.B.str.len()), 'B': np.concatenate(df.B.values)})

방법 3
다시 생성 목록:

pd.DataFrame([[x] + [z] for x, y in df.values for z in y], columns=df.columns)

방법 4
reindex 또는 loc 사용:

df.reindex(df.index.repeat(df.B.str.len())).assign(B=np.concatenate(df.B.values))

방법 5
목록이 고유한 내용만 포함 값:

from collections import ChainMap
d = dict(ChainMap(*map(dict.fromkeys, df['B'], df['A'])))
pd.DataFrame(list(d.items()), columns=df.columns[::-1])

방법 6
고성능을 위해 NumPy 사용:

newvalues = np.dstack((np.repeat(df.A.values, list(map(len, df.B.values))), np.concatenate(df.B.values)))
pd.DataFrame(data=newvalues[0], columns=df.columns)

방법 7
itertools 사용 사이클과 chain:

from itertools import cycle, chain
l = df.values.tolist()
l1 = [list(zip([x[0]], cycle(x[1])) if len([x[0]]) > len(x[1]) else list(zip(cycle([x[0]]), x[1]))) for x in l]
pd.DataFrame(list(chain.from_iterable(l1)), columns=df.columns)

여러 열로 일반화
여러 폭발 열을 처리하기 위해 함수를 정의할 수 있습니다.

def unnesting(df, explode):
    idx = df.index.repeat(df[explode[0]].str.len())
    df1 = pd.concat([
        pd.DataFrame({x: np.concatenate(df[x].values)}) for x in explode], axis=1)
    df1.index = idx

    return df1.join(df.drop(explode, 1), how='left')

unnesting(df, ['B', 'C'])

열- 현명한 중첩 해제
목록을 수평으로 확장하려면 pd.DataFrame을 사용하세요. 생성자:

df.join(pd.DataFrame(df.B.tolist(), index=df.index).add_prefix('B_'))

위 내용은 Pandas DataFrame 열을 여러 행으로 분해하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.