Pandas GroupBy MultiIndex 출력을 다시 DataFrame으로 변환
여러 인덱스 열이 있는 pandas DataFrame에서 그룹화 작업을 수행할 때 결과는 객체는 계층적 인덱스가 있는 DataFrame입니다. 개별 행으로 데이터에 액세스하려는 경우 이는 불편할 수 있습니다.
다음은 간단한 예입니다.
df1 = pd.DataFrame({"City": ["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portland"], "Name": ["Alice", "Bob", "Mallory", "Mallory", "Bob", "Mallory"]}) g1 = df1.groupby(["Name", "City"]).count()
g1의 출력은 계층적 인덱스가 있는 DataFrame입니다.
City Name Name City Alice Seattle 1 1 Bob Seattle 2 2 Mallory Portland 2 2 Seattle 1 1
이를 개별 행이 있는 DataFrame으로 다시 변환하려면 add_suffix 및 Reset_index를 사용할 수 있습니다. 메서드:
g1.add_suffix("_Count").reset_index()
이렇게 하면 인덱스 열에 접미사가 추가되고 인덱스가 재설정되어 플랫 DataFrame이 생성됩니다.
Name City City_Count Name_Count 0 Alice Seattle 1 1 1 Bob Seattle 2 2 2 Mallory Portland 2 2 3 Mallory Seattle 1 1
또는 크기 메서드와 Reset_index를 사용하여 각 그룹의 행 수를 세고 새 DataFrame을 만듭니다.
DataFrame({'count': df1.groupby(["Name", "City"]).size()}).reset_index()
이렇게 하면 단일 인덱스가 있는 DataFrame이 생성됩니다. 열:
Name City count 0 Alice Seattle 1 1 Bob Seattle 2 2 Mallory Portland 2 3 Mallory Seattle 1
사용하는 접근 방식은 특정 요구 사항에 따라 다릅니다.
위 내용은 Pandas GroupBy MultiIndex DataFrame을 평면화하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!