>  기사  >  백엔드 개발  >  Pandas MultiIndex DataFrame을 원래 단일 인덱스 형식으로 다시 변환하는 방법은 무엇입니까?

Pandas MultiIndex DataFrame을 원래 단일 인덱스 형식으로 다시 변환하는 방법은 무엇입니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-11-25 00:12:10200검색

How to Convert a Pandas MultiIndex DataFrame Back to its Original Single-Index Form?

Pandas MultiIndex DataFrame을 원래 형식으로 다시 변환

Pandas DataFrames로 작업할 때 데이터를 집계하기 위해 그룹화 작업을 수행하는 것이 일반적입니다. 그러나 그룹화 후 결과 DataFrame은 다중 인덱스 계층 구조를 갖게 되어 작업하기 어려울 수 있습니다. 이 기사에서는 샘플 DataFrame을 사용한 간단한 데모를 통해 다중 인덱스 DataFrame을 원래 형식으로 다시 변환하는 방법을 설명합니다.

문제

주어진 샘플 DataFrame에는 "City" 및 "Name" 열이 포함된 여러 행의 데이터가 포함되어 있습니다. DataFrame에서 GroupBy 작업을 수행하고 count() 함수를 사용하여 "이름"과 "도시"별로 집계합니다. 결과 그룹화된 DataFrame에는 ("이름", "도시")라는 다중 인덱스가 있습니다.

해결책

다중 인덱스 DataFrame을 다시 원래의 DataFrame으로 변환하려면 원래 형식에서는 add_suffix() 및 Reset_index() 함수를 사용할 수 있습니다. add_suffix() 함수는 열 이름에 접미사를 추가하고, Reset_index() 함수는 다중 인덱스를 단일 인덱스 DataFrame으로 변환합니다.

g1.add_suffix('_Count').reset_index()

결과 DataFrame에는 추가 인덱스가 포함된 원본 행이 포함됩니다. "이름"과 "도시"의 각 조합에 대한 개수를 나타내는 "_Count" 열.

대안 방법

다중 인덱스 DataFrame을 변환하는 또 다른 접근 방식은 DataFrame() 함수와 size() 함수를 사용하여 "이름"과 ""의 각 조합에 대한 행 수를 계산하는 새 DataFrame을 생성하는 것입니다. City".

DataFrame({'count' : df1.groupby( [ "Name", "City"] ).size()}).reset_index()

이 메서드에서는 add_suffix() 함수를 사용할 필요가 없지만 단일 "count" 열이 있는 DataFrame이 생성됩니다. 다중 인덱스의 각 수준에 대해 별도의 카운트 열 대신.

이러한 방법을 활용하면 다중 인덱스 DataFrame을 원래 형식으로 쉽게 변환하여 추가 데이터 조작 및 분석 작업을 용이하게 할 수 있습니다.

위 내용은 Pandas MultiIndex DataFrame을 원래 단일 인덱스 형식으로 다시 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.