>백엔드 개발 >파이썬 튜토리얼 >그룹화 후 Pandas DataFrame에서 가장 일반적인 값을 찾는 방법은 무엇입니까?

그룹화 후 Pandas DataFrame에서 가장 일반적인 값을 찾는 방법은 무엇입니까?

Patricia Arquette
Patricia Arquette원래의
2024-12-02 01:58:09122검색

How to Find the Most Common Value in a Pandas DataFrame After Grouping?

GroupBy pandas DataFrame 및 가장 일반적인 값 선택

여러 문자열 열로 데이터를 정리하려면 처음 두 열을 기준으로 그룹화하고 세 번째 열에 가장 일반적인 값을 선택하세요.

문제

제공된 코드는 다음과 같은 오류로 인해 실패합니다. KeyError가 발생하고 도시 열로만 그룹화하면 AssertionError가 발생합니다. 강력한 솔루션이 필요합니다.

솔루션

Post pandas v0.16, pd.Series.mode는 이 작업을 위한 다양하고 효율적인 방법을 제공합니다.

source.groupby(['Country', 'City'])['Short name'].agg(pd.Series.mode)

다중 모드 해결

그룹 내에 여러 모드가 있는 경우 Series.mode가 반환됩니다. 값 목록. 단일 결과를 얻으려면 람다 함수를 적용하세요.

source.groupby(['Country', 'City'])['Short name'].agg(lambda x: pd.Series.mode(x)[0])

고려할 대안

scipy.stats.mode도 사용할 수 있지만 여러 모드를 만나면 오류가 발생합니다.

위 내용은 그룹화 후 Pandas DataFrame에서 가장 일반적인 값을 찾는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.