>  기사  >  백엔드 개발  >  NumPy에서 인덱스 배열을 원-핫 인코딩하는 방법은 무엇입니까?

NumPy에서 인덱스 배열을 원-핫 인코딩하는 방법은 무엇입니까?

Linda Hamilton
Linda Hamilton원래의
2024-10-30 22:50:03566검색

How to One-Hot Encode Index Arrays in NumPy?

NumPy에서 인덱스 배열의 원-핫 인코딩

주어진 인덱스 배열을 원-핫 인코딩된 배열로 변환하는 것은 다음과 같습니다. 다양한 기계 학습 애플리케이션에 유용한 기술입니다. 원-핫 인코딩은 각 인덱스를 이진 벡터로 표현합니다. 여기서 인덱스의 해당 요소는 1이고 다른 모든 요소는 0입니다. 이 기술은 범주형 데이터를 처리할 때나 인덱스가 특성 값으로 사용되는 상황에서 특히 유용합니다.

NumPy에서 원-핫 인코딩을 달성하기 위해 우리는 간단한 프로세스를 따릅니다.

  1. 열 수가 인덱스의 최대값과 동일한 충분한 열이 있는 0으로 초기화된 배열을 만듭니다. 배열 + 1.
  2. 결과 배열의 각 행에 대해 해당 행의 인덱스에 해당하는 열을 1로 설정합니다.

제공된 예를 고려하세요.

<code class="python">a = np.array([1, 0, 3])
b = np.zeros((a.size, a.max() + 1))
b[np.arange(a.size), a] = 1</code>

이 예에서 인덱스 배열 a는 0에서 3까지의 값을 가지므로 4개의 열이 있는 0으로 채워진 배열 b를 만듭니다. 그런 다음 np.arange() 함수를 사용하여 b에 대한 행 인덱스 배열을 생성하고 a의 값을 기반으로 적절한 열을 1로 설정합니다.

결과 배열 b는 이제 원-핫 인코딩됩니다. 원본 인덱스 배열 a의 표현:

array([[ 0.,  1.,  0.,  0.],
       [ 1.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  1.]])

이 원-핫 인코딩 배열은 인덱스 값의 범주형 특성을 유지하고 기계 학습 알고리즘에서 효율적인 처리를 허용합니다.

위 내용은 NumPy에서 인덱스 배열을 원-핫 인코딩하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.