>  기사  >  백엔드 개발  >  `get_dummies` 및 `numpy` 없이 Pandas 범주형 열을 숫자 인덱스로 변환하는 방법은 무엇입니까?

`get_dummies` 및 `numpy` 없이 Pandas 범주형 열을 숫자 인덱스로 변환하는 방법은 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2024-10-27 22:51:02420검색

How to Convert Pandas Categorical Columns to Numerical Indices Without `get_dummies` and `numpy`?

Pandas 카테고리를 숫자로 변환

국가 코드와 같은 범주형 열이 있는 DataFrame을 고려하세요.

cc | temp
US | 37.0
CA | 12.0
US | 35.0
AU | 20.0

이 카테고리를 숫자로 변환하려면 get_dummies 및 numpy를 사용하지 않고 인덱스를 사용하려면 다음 단계를 고려하세요.

  1. 열 분류: 범주형 열을 범주형 유형으로 변환:
df.cc = pd.Categorical(df.cc)
  1. 범주 코드 검색: .codes 속성을 사용하여 각 범주에 대한 정수 코드를 검색합니다.
df['code'] = df.cc.codes

결과 DataFrame에는 다음이 포함됩니다. 숫자 인덱스가 있는 code라는 새 열:

   cc  temp  code
0  US  37.0     2
1  CA  12.0     1
2  US  35.0     2
3  AU  20.0     0

또는 DataFrame을 수정하지 않고 카테고리 코드를 얻을 수 있습니다:

df.cc.astype('category').codes
  1. 색인으로 사용: 원하는 경우 범주형 열을 다른 DataFrame의 인덱스로 사용할 수 있습니다.
df2 = pd.DataFrame(df.temp)
df2.index = pd.CategoricalIndex(df.cc)

위 내용은 `get_dummies` 및 `numpy` 없이 Pandas 범주형 열을 숫자 인덱스로 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.