데이터 정규화(Normalization)란 무엇입니까?
데이터가 작은 특정 간격에 속하도록 비례적으로 크기를 조정합니다. 다른 단위나 크기의 지표를 비교하고 가중치를 부여할 수 있도록 데이터의 단위 제한을 제거하고 이를 무차원 순수 값으로 변환하기 위해 일부 비교 및 평가 지수 처리에 자주 사용됩니다. (추천 학습: 웹 프론트엔드 동영상 튜토리얼)
일반적인 방법은 무엇인가요?
방법 1: 정규화 방법
분산 표준화라고도 하는데, 이는 원본 데이터를 선형 변환하여 결과를 [0,1] 구간에 매핑하는 것입니다.
방법 2: 정규화 방법
이 방법은 원본 데이터의 평균과 표준편차를 기준으로 데이터를 표준화합니다. z-점수를 사용하여 A의 원래 값 x를 x'로 정규화합니다.
z-점수 정규화 방법은 속성 A의 최대값과 최소값을 알 수 없거나 값 범위를 초과하는 이상값 데이터가 있는 경우에 적합합니다.
spss의 기본 표준화 방법은 z-점수 표준화입니다.
Excel을 사용하여 Z 점수를 표준화하는 방법: Excel에는 미리 만들어진 기능이 없으므로 단계별로 계산해야 합니다. 실제로 표준화 공식은 매우 간단합니다.
단계는 다음과 같습니다.
1. 각 변수(지표)의 산술 평균(수학적 기대값) xi 및 표준 편차 si를 찾습니다.
2. 표준화 처리를 수행합니다. )/ si
여기서: zij는 표준화된 변수 값입니다. xij는 실제 변수 값입니다.
3. 역지표 앞에 양수 및 음수 부호를 반대로 바꿉니다.
표준화변수 값은 0을 중심으로 변동합니다. 0보다 크면 평균 수준보다 높다는 뜻이고, 0보다 작으면 평균 수준보다 낮다는 뜻입니다.
방법 3: 정규화 방법
위 내용은 데이터 표준화 처리방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!