각 행 내에서 발생 횟수를 계산하려면 col5 및 col2 값의 고유한 조합을 기반으로 다음과 같이 size() 메서드를 사용합니다.
이 작업은 DataFrame을 col5와 col2로 그룹화하고 각 그룹 내의 행 수를 계산합니다. 출력은 인덱스 쌍(col5, col2)과 해당 개수가 포함된 시리즈입니다.
예:
<code class="python">df.groupby(['col5', 'col2']).size()</code>
제공된 코드 조각은 df DataFrame을 사용하여 이 작업을 보여줍니다. 다음 출력이 생성됩니다.
이 출력에서 각 행은 col5와 col2의 고유한 조합을 나타내며 해당 개수는 해당 조합이 DataFrame에서 발생하는 횟수를 나타냅니다.
각 col2 값에 대한 최대 개수 찾기:
col5 col2 1 A 1 D 3 2 B 2 3 A 3 C 1 4 B 1 5 B 2 6 B 1 dtype: int64
col2의 각 고유 값에 대한 최대 개수를 확인하려면 다음 단계를 수행합니다.
DataFrame을 다음과 같이 그룹화합니다. col2만, col5는 제외.
size()를 사용하여 각 col2 그룹의 행 개수를 계산합니다.그룹화된 계열에 대해 max() 메서드를 사용하여 각 col2 그룹의 최대 개수를 가져옵니다.이 출력에서 각 col2 값은 col2에서 해당 값을 공유하는 최대 행 수와 연결됩니다.
위 내용은 Pandas DataFrame을 여러 열로 그룹화하고 계산하고 최대 개수를 찾는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!