데이터 프레임의 열 정규화
데이터 세트에서는 여러 열이 다양한 값 범위를 갖는 것이 일반적입니다. 이로 인해 데이터를 비교하고 분석하기가 어려울 수 있습니다. 열을 정규화하면 일반적으로 0과 1 사이의 공통 범위로 조정되므로 비교와 분석이 더 쉬워집니다.
인기 있는 데이터 분석 라이브러리인 Pandas에서 열을 정규화하는 한 가지 방법은 평균 정규화입니다. 각 값에서 평균을 빼고 그 결과를 표준편차로 나누는 작업이 포함됩니다. 이는 다음 수식에서 볼 수 있듯이 값을 평균 0과 표준 편차 1로 변환합니다.
normalized_df = (df - df.mean()) / df.std()
또는 최소-최대 정규화를 사용할 수도 있습니다. 이 방법은 열의 최소값과 최대값을 기준으로 값의 크기를 조정합니다. 최소-최대 정규화 공식은 다음과 같습니다.
normalized_df = (df - df.min()) / (df.max() - df.min())
두 방법 중 하나를 적용하려면 데이터 프레임에 제공된 공식을 사용하면 됩니다. Pandas는 자동으로 함수를 열 단위로 적용하여 각 열을 독립적으로 정규화합니다.
위 내용은 비교 및 분석을 위해 데이터프레임의 열을 정규화하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!