>백엔드 개발 >파이썬 튜토리얼 >Python을 사용하여 통계에서 68-95-99.7 규칙 시연

Python을 사용하여 통계에서 68-95-99.7 규칙 시연

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB
WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB앞으로
2023-09-05 13:33:10835검색

Python을 사용하여 통계에서 68-95-99.7 규칙 시연

통계는 데이터를 분석하고 이해할 수 있는 강력한 도구를 제공합니다. 통계의 기본 개념 중 하나는 경험 법칙 또는 3시그마 법칙이라고도 알려진 68-95-99.7 규칙입니다. 이 규칙을 사용하면 표준 편차를 기반으로 데이터 분포에 대해 중요한 추론을 할 수 있습니다. 이 블로그 게시물에서는 68-95-99.7 규칙을 살펴보고 Python을 사용하여 이를 적용하는 방법을 보여줍니다.

68-95-99.7 규칙 개요

68-95-99.7 규칙은 평균에서 특정 표준 편차 내에 있는 정규 분포의 데이터 비율을 추정하는 방법을 제공합니다. 이 규칙에 따르면 -

  • 데이터의 약 68%가 평균의 1표준편차 내에 속합니다.

  • 데이터의 약 95%가 평균의 2표준편차 내에 속합니다.

  • 데이터의 약 99.7%가 평균의 3 표준편차 내에 속합니다.

이 백분율은 정규 분포(종형 곡선이라고도 함)를 따르는 데이터 세트에 대한 것입니다. 이 규칙을 이해하면 데이터의 확산을 신속하게 평가하고 특이치 또는 비정상적인 관찰을 식별할 수 있습니다.

Python에서 68-95-99.7 규칙 구현

68-95-99.7 규칙이 실제로 실행되는 모습을 보여주기 위해 Python과 인기 있는 데이터 분석 라이브러리 NumPy를 사용하겠습니다. NumPy는 필요한 값을 계산하는 데 도움이 되는 효율적인 수치 연산과 통계 기능을 제공합니다. 먼저 필요한 라이브러리를 가져오겠습니다

으아아아

다음으로 numpy.random.normal() 함수를 사용하여 정규 분포를 따르는 무작위 데이터 세트를 생성하겠습니다. 평균 0과 표준편차 1을 사용하겠습니다

으아아아

이제 데이터 세트의 평균과 표준편차를 계산할 수 있습니다

으아아아

68-95-99.7 규칙이 적용되는 데이터와 영역을 시각화하기 위해 matplotlib.pyplot.hist() 함수를 사용하여 히스토그램을 만들 수 있습니다

으아아아

생성된 히스토그램은 점선으로 표시된 평균 및 표준 편차와 함께 데이터 분포를 표시합니다.

각 범위에 포함되는 백분율을 계산하려면 정규 분포의 누적 분포 함수(CDF)를 사용할 수 있습니다. NumPy 함수 numpy.random.normal()은 정규 분포 데이터를 생성하지만 NumPy는 CDF를 계산하기 위해 numpy.random.normal()도 제공합니다

으아아아

이 코드를 실행하면 평균의 1, 2, 3 표준편차 내에 속하는 데이터의 비율이 표시됩니다.

으아아아

이러한 결과는 68-95-99.7 규칙의 예상 비율과 매우 일치합니다.

68-95-99.7 규칙 설명

각 범위에 포함되는 백분율에는 특정한 해석이 있습니다. 평균의 1 표준편차 내에 속하는 데이터는 상대적으로 흔한 반면, 평균의 3 표준편차를 벗어나는 데이터는 드문 것으로 간주됩니다. 이러한 설명을 이해하면 데이터에 대해 의미 있는 추론을 하는 데 도움이 됩니다.

68-95-99.7 규칙 제한

68-95-99.7 규칙은 귀중한 지침이지만 정규 분포에서 크게 벗어나는 데이터 세트에는 정확하게 적용되지 않을 수 있습니다. 이러한 데이터 세트로 작업할 때는 다른 통계 기법을 고려하고 추가 분석을 수행하는 것이 중요합니다.

아웃라이어와 68-95-99.7 규칙

이상값은 각 범위에 포함되는 백분율의 정확도에 큰 영향을 미칠 수 있습니다. 이러한 극단값은 분포를 왜곡하고 규칙의 효율성에 영향을 미칠 수 있습니다. 정확한 통계 분석을 위해서는 이상값을 적절하게 식별하고 처리하는 것이 중요합니다.

실제 사례

68-95-99.7 규칙은 모든 영역에 적용됩니다. 예를 들어, 품질 관리 프로세스에서 결함이 있는 제품을 식별하고, 재무 분석에서 위험 및 투자 수익을 평가하고, 의료 연구에서 환자 특성을 이해하고, 기타 여러 영역에서 데이터 분포를 이해하는 데 매우 중요합니다.

통계를 더 깊이 파고들면서 68-95-99.7 규칙을 보완하는 다른 개념을 탐색해 보세요. 왜도, 첨도, 신뢰 구간, 가설 검정, 회귀 분석은 데이터에 대한 이해와 분석을 더욱 향상시킬 수 있는 통계 도구의 몇 가지 예에 불과합니다.

결론

68-95-99.7 규칙은 표준 편차 측면에서 데이터 분포를 이해할 수 있게 해주는 통계의 강력한 개념입니다. 이 규칙을 적용하면 평균을 중심으로 특정 범위에 속하는 데이터의 비율을 추정할 수 있습니다. 이 블로그에서는 Python과 NumPy 라이브러리를 사용하여 임의의 데이터 세트를 생성하고 시각화하고 각 범위의 백분율 적용 범위를 계산합니다. 이 규칙을 이해하면 데이터에 대해 의미 있는 추론을 할 수 있고 잠재적인 특이점이나 비정상적인 관찰을 식별할 수 있습니다.

위 내용은 Python을 사용하여 통계에서 68-95-99.7 규칙 시연의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 tutorialspoint.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제