여러 문자열 열로 데이터를 정리하려면 처음 두 열을 기준으로 그룹화하고 세 번째 열에 가장 일반적인 값을 선택하세요.
제공된 코드는 다음과 같은 오류로 인해 실패합니다. KeyError가 발생하고 도시 열로만 그룹화하면 AssertionError가 발생합니다. 강력한 솔루션이 필요합니다.
Post pandas v0.16, pd.Series.mode는 이 작업을 위한 다양하고 효율적인 방법을 제공합니다.
source.groupby(['Country', 'City'])['Short name'].agg(pd.Series.mode)
그룹 내에 여러 모드가 있는 경우 Series.mode가 반환됩니다. 값 목록. 단일 결과를 얻으려면 람다 함수를 적용하세요.
source.groupby(['Country', 'City'])['Short name'].agg(lambda x: pd.Series.mode(x)[0])
scipy.stats.mode도 사용할 수 있지만 여러 모드를 만나면 오류가 발생합니다.
위 내용은 그룹화 후 Pandas DataFrame에서 가장 일반적인 값을 찾는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!