Pandas: 카테고리를 숫자 인덱스로 변환
Pandas 데이터 프레임의 카테고리를 숫자 인덱스로 변환하려면 제공된 효율적인 방법을 따를 수 있습니다. 사용자별:
1단계: 열 분류
먼저 대상 열(이 경우 cc)을 범주형 유형으로 변환합니다:
<code class="python">df.cc = pd.Categorical(df.cc)</code>
2단계: 카테고리 코드 캡처
카테고리 코드를 저장하기 위해 code라는 새 열을 만듭니다.
<code class="python">df['code'] = df.cc.codes</code>
결과:
이제 데이터 프레임에는 카테고리에 해당하는 인덱스가 있는 코드 열이 포함됩니다.
cc | temp | code |
---|---|---|
US | 37.0 | 2 |
CA | 12.0 | 1 |
US | 35.0 | 2 |
AU | 20.0 | 0 |
추가 옵션:
<code class="python">df.cc.astype('category').codes</code>
<code class="python">df2 = pd.DataFrame(df.temp) df2.index = pd.CategoricalIndex(df.cc)</code>
위 내용은 Pandas에서 범주형 데이터를 숫자 인덱스로 효율적으로 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!