이 기사에서는 Python 프로그램을 구현하여 데이터 세트의 표준 편차를 계산하는 방법을 알아봅니다.
임의의 축에 표시된 값 집합을 생각해 보세요. 이러한 값 세트의 표준편차 를 모집단 이라고 하며 이들 값 사이의 변동으로 정의됩니다. 표준편차가 낮으면 표시된 값이 평균에 더 가까워집니다. 그러나 표준편차가 높을수록 값은 평균에서 더 멀어지게 됩니다.
데이터 세트의 분산의 제곱근으로 표시됩니다. 표준편차에는 두 가지 유형이 있습니다 -
모집단 표준편차는 모집단의 각 데이터 값에서 계산됩니다. 따라서 고정된 값입니다. 수학 공식은 다음과 같이 정의됩니다 -
$$mathrm{SD:=:sqrt{frac{sum(X_i:-:X_m)^2}{n}}}$$
어디,
(어디)Xm은 데이터 세트의 평균입니다.
Xi은 데이터세트의 요소입니다.
n은 데이터세트의 요소 수입니다.
단, 표본 표준편차는 모집단의 특정 데이터 값에 대해서만 계산된 통계이므로 선택한 표본에 따라 그 값이 달라집니다. 수학 공식은 다음과 같이 정의됩니다 −
$$mathrm{SD:=:sqrt{frac{sum(X_i:-:X_m)^2}{n:-:1}}}$$
어디,
(어디)Xm은 데이터 세트의 평균입니다.
Xi은 데이터세트의 요소입니다.
n은 데이터세트의 요소 수입니다.
이제 다양한 데이터 세트에 대한 몇 가지 입력 및 출력 시나리오를 살펴보겠습니다. -
데이터 세트에 양의 정수만 포함되어 있다고 가정합니다. -
으아악데이터 세트에 음수만 포함되어 있다고 가정합니다. -
으아악데이터 세트에 양수와 음수 정수만 포함되어 있다고 가정합니다. -
으아악우리는 이미 같은 기사에서 표준편차 공식을 살펴보았습니다. 이제 Python 프로그램을 사용하여 다양한 데이터 세트에 수학 공식을 구현하는 방법을 살펴보겠습니다.
아래 예에서는 math 라이브러리를 가져오고 sqrt() 내장 함수를 적용하여 데이터 세트의 표준 편차와 분산을 계산합니다.
으아악구해진 출력 표준편차는 다음과 같습니다 -
으아악이 접근 방식에서는 numpy 모듈을 가져오고 numpy.std() 함수를 사용하여 numpy 배열 요소의 모집단 표준 편차를 계산합니다.
다음 Python 프로그램을 구현하여 numpy 배열 요소의 표준 편차를 계산하세요. -
으아악표준편차는 다음과 같이 출력됩니다. -
으아악Python의 Statistics 모듈은 샘플 데이터 세트의 표준 편차를 계산하기 위해 stdev() 및 pstdev()라는 함수를 제공합니다. Python의 stdev() 함수는 표본 표준 편차만 계산하는 반면, pstdev() 함수는 모집단 표준 편차를 계산합니다.
두 함수의 매개변수와 반환 유형은 동일합니다.
데이터 세트의 표본 표준 편차를 계산하기 위해 stdev() 함수를 사용하는 방법을 보여주는 Python 프로그램은 다음과 같습니다. −
으아악출력으로 얻은 데이터셋의 표본 표준편차는 다음과 같습니다 -
으아악pstdev() 함수를 사용하여 데이터 세트의 전체 표준 편차를 찾는 방법을 보여주는 Python 프로그램은 다음과 같습니다. -
으아악출력으로 얻은 데이터셋의 표본 표준편차는 다음과 같습니다 -
으으으으위 내용은 표준편차를 계산하는 Python 프로그램의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!