>백엔드 개발 >파이썬 튜토리얼 >Pandas의 Melt 기능은 어떻게 추가 열을 사용하여 넓은 데이터 프레임을 원하는 긴 형식으로 재구성할 수 있습니까?

Pandas의 Melt 기능은 어떻게 추가 열을 사용하여 넓은 데이터 프레임을 원하는 긴 형식으로 재구성할 수 있습니까?

Barbara Streisand
Barbara Streisand원래의
2024-12-08 08:40:12938검색

How Can Pandas' Melt Function Reshape Wide Dataframes into a Desired Long Format with Additional Columns?

데이터 변환을 위한 Pandas Melt 기능

Pandas에서 복잡한 데이터 재구성 작업에 직면했을 때 Melt 기능은 강력한 도구로 떠오릅니다. 여러 열이 포함된 넓은 형식의 데이터프레임을 더 적은 수의 열이 포함된 긴 형식으로 원활하게 변환합니다.

실제 시나리오에서는 재구성이 필요한 데이터프레임을 고려해 보세요.

df = pd.DataFrame([[2, 4, 7, 8, 1, 3, 2013], [9, 2, 4, 5, 5, 6, 2014]],
               columns=['Amy', 'Bob', 'Carl', 'Chris', 'Ben', 'Other', 'Year'])
   Amy  Bob  Carl  Chris  Ben  Other  Year
0    2    4     7      8    1      3  2013
1    9    2     4      5    5      6  2014

이를 변환하려면 데이터프레임을 보다 구조화된 형식으로 변환하려면 Melt 기능을 사용할 수 있습니다.

m = pd.melt(df, id_vars=['Year'], var_name='Name')

이 작업은 다음을 생성합니다. dataframe:

    Year   Name  value
0   2013    Amy      2
1   2014    Amy      9
2   2013    Bob      4
3   2014    Bob      2
4   2013   Carl      7
...

그러나 원하는 출력에는 "Group"이라는 추가 열이 포함되어 있습니다. 이를 얻으려면 사전의 모양을 변경하세요.

d2 = {}
for k, v in d.items():
    for item in v:
        d2[item] = k

이제 데이터 프레임을 "그룹" 열로 업데이트할 수 있습니다.

m['Group'] = m['Name'].map(d2)

마지막으로 '이름'에서 '기타'를 이동하세요. 열을 '그룹' 열로:

mask = m['Name'] == 'Other'
m.loc[mask, 'Name'] = ''
m.loc[mask, 'Group'] = 'Other'

결과 데이터 프레임은 원하는 것과 완벽하게 일치합니다. 출력:

    Year   Name  value  Group
0   2013    Amy      2      A
1   2014    Amy      9      A
2   2013    Bob      4      B
3   2014    Bob      2      B
4   2013   Carl      7      C
...

이러한 방식으로 Pandas Melt 기능은 데이터 과학자에게 데이터 프레임 재구성을 위한 다양하고 효율적인 메커니즘을 제공하여 다양한 분석 및 시각화 목적을 위해 데이터를 쉽게 변환하고 재구성할 수 있도록 해줍니다.

위 내용은 Pandas의 Melt 기능은 어떻게 추가 열을 사용하여 넓은 데이터 프레임을 원하는 긴 형식으로 재구성할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.