여러 데이터프레임 열을 기반으로 빈도 수 가져오기
동일한 행이 데이터프레임에 얼마나 자주 나타나는지 확인하려면 Pandas의 groupby를 사용할 수 있습니다. 기능. 다음 예를 고려하십시오.
data = {'Group': ['Short', 'Short', 'Moderate', 'Moderate', 'Tall'], 'Size': ['Small', 'Small', 'Medium', 'Small', 'Large']} df = pd.DataFrame(data)
세 가지 방법으로 빈도 수를 계산할 수 있습니다.
옵션 1:
dfg = df.groupby(by=["Group", "Size"]).size()
이것은 다음 출력이 포함된 시리즈:
Group Size Moderate Medium 1 Small 1 Short Small 2 Tall Large 1 dtype: int64
옵션 2:
dfg = df.groupby(by=["Group", "Size"]).size().reset_index(name="Time")
이렇게 하면 "시간" 열이 추가된 DataFrame이 생성됩니다.
Group Size Time 0 Moderate Medium 1 1 Moderate Small 1 2 Short Small 2 3 Tall Large 1
옵션 3:
dfg = df.groupby(by=["Group", "Size"], as_index=False).size()
옵션 2의 출력과 동일한 DataFrame도 생성됩니다.
위 내용은 Pandas DataFrame에서 동일한 행의 빈도를 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!