Pandas에서 넓은 데이터를 Long으로 재구성
많은 데이터 조작 작업에서는 데이터 세트가 특정 형식(종종 long 또는 long이라고 함)이어야 합니다. 광범위한 데이터. Pandas에서는 pd.melt 또는 DataFrame.melt 함수를 통해 넓은 형태에서 긴 형태로 재구성할 수 있습니다.
원본 데이터:
다음과 같은 넓은 데이터 프레임을 고려하세요. 날짜는 인덱스이고 열은 다른 것을 나타냅니다. 변수:
AA BB CC date 05/03 1 2 3 06/03 4 5 6 07/03 7 8 9 08/03 5 7 1
긴 형식으로 변경:
이 데이터프레임을 긴 형식으로 변경하려면 다음을 사용할 수 있습니다. 여기서 각 행은 단일 날짜와 변수 조합을 나타냅니다. :
df = df.reset_index().melt(id_vars='date')
이렇게 하면 데이터 프레임이 변환됩니다. into:
date variable value 0 05/03 AA 1 1 06/03 AA 4 2 07/03 AA 7 3 08/03 AA 5 4 05/03 BB 2 5 06/03 BB 5 6 07/03 BB 8 7 08/03 BB 7 8 05/03 CC 3 9 06/03 CC 6 10 07/03 CC 9 11 08/03 CC 1
또는 Melt 함수에서ignore_index=False를 지정하여 Reset_index 단계를 생략할 수 있습니다.
dfm = df.melt(ignore_index=False)
이렇게 하면 행 인덱스가 보장됩니다. 변환된 데이터 프레임에 보존됩니다.
위 내용은 Pandas에서 넓은 데이터를 긴 형식으로 효율적으로 변환하려면 어떻게 해야 할까요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!