Pandas: 카테고리를 숫자 인덱스로 변환
Pandas에서는 국가, 숫자 인덱스로. pd.get_dummies는 카테고리를 원-핫 인코딩으로 변환할 수 있지만 항상 가장 효율적인 솔루션은 아닙니다. 다음은 카테고리를 숫자 인덱스로 변환하는 방법에 대한 단계별 가이드입니다.
1단계: 열 분류
먼저 열 유형을 다음으로 변경합니다. categorical:
<code class="python">df.cc = pd.Categorical(df.cc)</code>
국가 열을 pd.Categorical(column_name)으로 표시되는 범주형 열로 변환합니다.
2단계: 코드에 대한 새 열 만들기
다음으로 숫자 인덱스를 저장할 새 열을 만듭니다.
<code class="python">df['code'] = df.cc.codes</code>
범주형 열의 코드 속성은 각 범주에 고유한 정수 인덱스를 할당합니다.
예:
다음 DataFrame을 고려하세요.
cc temp 0 US 37.0 1 CA 12.0 2 US 35.0 3 AU 20.0
위 단계를 수행하면 새 DataFrame이 생성됩니다.
cc temp code 0 US 37.0 2 1 CA 12.0 1 2 US 35.0 2 3 AU 20.0 0
추가 옵션:
위 내용은 Pandas에서 범주형 데이터를 숫자 인덱스로 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!