테이블 형식의 데이터를 재구성하는 것은 데이터 분석에서 필수적인 작업입니다. 데이터 프레임의 행과 열을 바꾸는 기술인 피벗은 피벗 테이블을 만들고 다양한 관점에서 데이터를 탐색하는 데 유용한 경우가 많습니다. 강력한 데이터 조작 라이브러리인 Pandas에서 이 작업을 수행하는 방법을 살펴보겠습니다.
데이터 프레임을 피벗하려면 주로 .pivot 메서드를 사용합니다. 이 메서드는 여러 인수를 사용합니다.
예를 들어 다음 데이터 프레임을 고려해보세요.
Indicator Country Year Value 1 Angola 2005 6 2 Angola 2005 13 3 Angola 2005 10 4 Angola 2005 11 5 Angola 2005 5 1 Angola 2006 3 2 Angola 2006 2 3 Angola 2006 7 4 Angola 2006 3 5 Angola 2006 6
표시기 열의 값이 새 열이 되도록 이 데이터 프레임을 피벗하려면 다음을 사용합니다. 코드:
out = df.pivot(index=['Country', 'Year'], columns='Indicator', values='Value') print(out)
이 작업은 다음과 같은 피벗된 데이터 프레임을 생성합니다.
Indicator 1 2 3 4 5 Country Year Angola 2005 6 13 10 11 5 2006 3 2 7 3 6
피벗된 데이터 프레임을 다시 플랫 테이블로 변환하려면 .rename_axis를 사용하여 표시기 축과 을 제거합니다. 국가 및 연도를 다시 일반 열로 변환하려면 Reset_index를 사용하세요.
print(out.rename_axis(columns=None).reset_index())
이렇게 하면 원래 데이터 프레임이 생성됩니다. 구조:
Country Year 1 2 3 4 5 0 Angola 2005 6 13 10 11 5 1 Angola 2006 3 2 7 3 6
데이터에 중복된 레이블 조합(예: 국가, 연도, 표시기)이 포함된 경우 .pivot_table을 사용하세요. 이 방법은 기본적으로 평균을 사용합니다.
out = df.pivot_table( index=['Country', 'Year'], columns='Indicator', values='Value') print(out.rename_axis(columns=None).reset_index())
이 방법은 유사한 피벗 데이터프레임을 출력하지만 중복 조합에 대한 평균 값을 사용합니다.
자세한 개요는 Pandas 사용자를 참조하세요. 재형성 및 피벗 테이블에 대한 안내입니다.
위 내용은 Pandas를 사용하여 데이터프레임을 피벗하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!