Brown-Forsythe 검정은 둘 이상의 그룹의 분산이 동일한지 여부를 확인하는 데 사용되는 통계 검정입니다. Levene의 검정은 평균과의 절대 편차를 사용하는 반면 Brown-Forsythe 검정은 중앙값과의 편차를 사용합니다.
검정에 사용된 귀무가설은 다음과 같습니다 -
H0: 그룹(인구)의 분산이 동일합니다
대립 가설은 분산이 동일하지 않다는 것입니다 -
H1: 그룹(인구)의 분산이 동일하지 않습니다
테스트를 수행하기 위해 각 그룹의 중앙값과 중앙값의 절대 편차를 계산합니다. 그런 다음 이러한 편차의 분산을 기반으로 F 통계를 계산합니다. 계산된 F 통계량이 F 분포표의 임계값보다 크다고 가정합니다. 이 경우 귀무 가설을 기각하고 그룹의 분산이 동일하지 않다는 결론을 내립니다.
Python에서 scipy 및 statsmodels 라이브러리는 Brown-Forsythe 테스트를 수행하는 방법을 제공합니다.
Brown-Forsythe 테스트는 특이치에 민감하지만 Levene 테스트보다 비정규성에 더 강력하다는 점은 주목할 가치가 있습니다. 데이터가 비정상적인 경우 일반적으로 Brown-Forsythe 테스트를 사용하는 것이 좋습니다.
sample1, Sample2, …sampleN - 길이가 다를 수 있는 샘플 데이터입니다. 샘플에는 하나의 차원만 허용되어야 합니다.
Center - 테스트용 데이터 기능입니다. 중앙값이 기본값입니다.
Proportiontocut - 중심이 "잘라질" 때 각 끝에서 제거되는 데이터 포인트 수를 나타냅니다.
levene() 함수에서 사용자는 매개변수 중심과 함께 다양한 길이의 1D 샘플 데이터를 "Median"으로 전달해야 합니다. 그런 다음 함수는 제공된 샘플에 대한 통계 및 p_value를 반환합니다.
scipy에서 levene 함수를 가져옵니다.
Brown-Forsythe 테스트를 수행할 데이터 샘플을 만듭니다.
샘플 데이터를 levene 함수에 전달하여 테스트를 실행합니다.
함수에서 통계와 p_value를 반환합니다.
통계를 이용할 수 있습니다. scipy 라이브러리의 Levene 방법은 Brown-Forsythe 테스트를 수행하는 데 사용됩니다.
으아악여기서 p-값이 1로 0.05보다 큰 것을 볼 수 있습니다. 이는 귀무가설을 받아들일 수 있음을 의미합니다. 따라서 두 그룹의 분산은 동일합니다. 따라서 대립가설은 기각된다.
Brown-Forsythe 문제를 구현하는 것 외에도 기계 학습 엔지니어가 직면하는 일반적인 혼란을 명확히 해야 합니다. 이것이 Brown-Forsythe와 ANOVA 테스트가 서로 관련되는 방식입니다.
Brown-Forsythe 및 ANOVA(분산 분석) 테스트는 그룹 평균의 차이를 테스트하기 때문에 관련이 있습니다. 그러나 그들은 서로 다른 가설을 테스트하고 서로 다른 적용을 가지고 있습니다.
분산 분석은 두 개 이상의 그룹의 평균 간에 유의미한 차이가 있는지 여부를 테스트하는 데 사용되는 통계 방법입니다. 이는 그룹의 분산이 동일하고 데이터가 정규 분포를 따른다고 가정합니다. 분산 분석은 두 개 이상의 그룹의 평균이 동일한지 확인하고 그룹의 분산을 비교하는 데 사용됩니다.
Brown-Forsythe 테스트는 평균과의 절대 편차를 사용하는 Levene 테스트의 변형인 반면, Brown-Forsythe 테스트는 중앙값과의 편차를 사용합니다. 반면, Brown-Forsythe 검정은 분산의 동질성을 검정하는 것으로, 이는 분산 분석에 필요한 가정입니다. 둘 이상의 그룹의 분산이 동일한지 여부를 확인하는 데 사용됩니다.
실제로는 등분산 가정이 충족되는지 확인하기 위해 ANOVA 이전에 Brown-Forsythe 테스트를 수행하는 것이 일반적입니다. 분산이 동일하지 않은 경우 일반 테스트 대신 비모수 테스트(예: Kruskal-Wallis 테스트 또는 Welch의 ANOVA 테스트)를 사용하는 것이 적절할 수 있습니다.
Brown-Forsythe 테스트는 생물학, 의학, 심리학, 사회과학, 공학 등 다양한 분야에서 다양한 그룹의 등분산을 테스트하는 데 사용됩니다. 일반적인 사용 사례는 다음과 같습니다 -
두 개 이상의 표본 분산 비교 - Brown-Forsythe 검정은 두 개 이상의 표본 분산이 동일한지 여부를 확인할 수 있습니다. 예를 들어, 의학 연구에서 이 테스트를 사용하여 다양한 환자 그룹의 혈압 측정값의 차이를 비교할 수 있습니다.
ANOVA를 수행하기 전에 분산의 동질성 테스트 - Brown-Forsythe 테스트는 분산의 동질성에 대한 테스트이므로 ANOVA를 수행하기 전에 등분산 가정이 충족되는지 확인하는 데 사용할 수 있습니다. 이렇게 하면 ANOVA 결과가 유효한지 확인할 수 있습니다.
비정규 분포 데이터의 등분산 테스트 - Brown-Forsythe 테스트는 Levene 테스트보다 비정규성에 더 강력합니다. 비정규 분포 데이터의 등분산을 테스트하는 데 사용할 수 있습니다.
반복 측도 설계의 분산 비교 - 반복 측도 설계를 사용하여 실험을 수행할 때 그룹 간 분산의 동질성을 확인하려면 Brown-Forsythe 검정을 사용하는 것이 유용합니다.
제조 품질 관리 - Brown-Forsythe 테스트는 일관된 제품 품질을 보장하기 위해 다양한 생산 배치의 등분산을 확인하는 데 사용할 수 있습니다.
요약하자면, Brown-Forsythe 테스트는 데이터 세트에서 이분산성의 존재를 탐지하는 데 유용한 통계 방법입니다. scipy 라이브러리를 사용하여 Python에서 쉽게 구현할 수 있습니다. 테스트 결과는 데이터의 적절한 통계 분석 수행에 대한 결정을 알려줄 수 있습니다. 테스트된 가설을 이해하고 결과를 해석함으로써 연구자는 데이터 분포를 더 잘 이해하고 분석에 대해 정보에 입각한 결정을 내릴 수 있습니다.
위 내용은 Python에서 Brown-Forsythe 테스트를 수행하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!