데이터 프레임의 공통 열 값을 기준으로 행 계산
많은 데이터 세트에는 특정 열에 대해 동일한 값을 가진 중복 행이 포함되어 있습니다. 이러한 발생 빈도를 분석하기 위해 DataFrame 그룹화 기술을 사용할 수 있습니다.
"Group" 및 "Size" 열로 구성된 DataFrame을 생각해 보세요.
Group | Size | Time |
---|---|---|
Short | Small | 2 |
Moderate | Medium | 1 |
Moderate | Small | 1 |
Tall | Large | 1 |
GroupBy 및 Size
pandas groupby 기능을 사용하면 지정된 열을 기준으로 행을 그룹화할 수 있습니다. 크기 함수는 각 그룹 내의 행 수를 계산하는 편리한 방법을 제공합니다.
<code class="python">import pandas as pd # Load the sample data data = {'Group': ['Short', 'Short', 'Moderate', 'Moderate', 'Tall'], 'Size': ['Small', 'Small', 'Medium', 'Small', 'Large']} df = pd.DataFrame(data) # Group by "Group" and "Size" columns dfg = df.groupby(by=["Group", "Size"]).size()</code>
이 작업은 다음 출력과 함께 시리즈를 반환합니다.
Group Size Moderate Medium 1 Small 1 Short Small 2 Tall Large 1 dtype: int64
재설정 인덱스 및 선택성
시리즈를 개수 열이 있는 DataFrame으로 변환하려면 Reset_index를 사용하고 새 열의 이름을 지정할 수 있습니다.
<code class="python">dfg = df.groupby(by=["Group", "Size"]).size().reset_index(name="Time")</code>
추가로, 특정 요구 사항에 따라 as_index 매개변수와 함께 groupby 함수의 변형을 사용할 수 있습니다.
<code class="python"># Option 1: Explicitly set index to True dfg = df.groupby(by=["Group", "Size"], as_index=True).size() # Option 2: Leave index unchanged (default) dfg = df.groupby(by=["Group", "Size"]).size() # Option 3: Explicitly set index to False dfg = df.groupby(by=["Group", "Size"], as_index=False).size()</code>
위 내용은 Pandas DataFrame의 공통 열 값을 기반으로 행 수를 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!