>  기사  >  백엔드 개발  >  Pandas에서 범주형 데이터를 숫자 인덱스로 변환하는 방법은 무엇입니까?

Pandas에서 범주형 데이터를 숫자 인덱스로 변환하는 방법은 무엇입니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-10-28 11:00:30784검색

How to Convert Categorical Data to Numerical Indices in Pandas?

Pandas: 카테고리를 숫자 인덱스로 변환

Pandas에서는 국가, 숫자 인덱스로. pd.get_dummies는 카테고리를 원-핫 인코딩으로 변환할 수 있지만 항상 가장 효율적인 솔루션은 아닙니다. 다음은 카테고리를 숫자 인덱스로 변환하는 방법에 대한 단계별 가이드입니다.

1단계: 열 분류

먼저 열 유형을 다음으로 변경합니다. categorical:

<code class="python">df.cc = pd.Categorical(df.cc)</code>

국가 열을 pd.Categorical(column_name)으로 표시되는 범주형 열로 변환합니다.

2단계: 코드에 대한 새 열 만들기

다음으로 숫자 인덱스를 저장할 새 열을 만듭니다.

<code class="python">df['code'] = df.cc.codes</code>

범주형 열의 코드 속성은 각 범주에 고유한 정수 인덱스를 할당합니다.

예:

다음 DataFrame을 고려하세요.

   cc  temp
0  US  37.0
1  CA  12.0
2  US  35.0
3  AU  20.0

위 단계를 수행하면 새 DataFrame이 생성됩니다.

   cc  temp  code
0  US  37.0     2
1  CA  12.0     1
2  US  35.0     2
3  AU  20.0     0

추가 옵션:

  • DataFrame을 수정하지 않고 코드 가져오기: df.cc.astype('category').codes
  • 범주형 열을 인덱스로 생성: df2 = pd.DataFrame(df.temp); df2.index = pd.CategoricalIndex(df.cc)

위 내용은 Pandas에서 범주형 데이터를 숫자 인덱스로 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.