>일반적인 문제 >부트스트랩 방법은 무엇을 의미하나요?

부트스트랩 방법은 무엇을 의미하나요?

藏色散人
藏色散人원래의
2019-07-16 10:52:287480검색

부트스트랩 방법은 무엇을 의미하나요?

부트스트랩 방법은 무엇을 의미합니까? 부트스트랩 방법은 통계의 변동성을 추정하고 통계의 간격을 추정할 수 있는 비모수 통계에서 중요한 통계 방법입니다.

핵심 아이디어와 기본 단계는 다음과 같습니다.

(1) 반복 샘플링 기술을 사용하여 원본 샘플에서 특정 수의 샘플(직접 제공 가능, 일반적으로 원본 샘플과 동일)을 추출하는 과정입니다. 반복 샘플링을 허용합니다.

(2) 추출된 샘플을 기반으로 추정할 통계 T를 계산합니다.

(3) 위의 작업을 N회(일반적으로 1000보다 큼) 반복하여 N개의 통계 T를 얻습니다.

(4) 위 N 통계량 T의 표본 분산을 계산하여 통계량 T의 분산을 추정합니다.

부트스트랩은 현대 통계에서 널리 사용되는 통계 방법이며, 작은 표본으로 작업할 때 잘 작동한다고 해야 할까요. 분산추정을 통해 신뢰구간을 구축할 수 있으며, 적용 범위가 더욱 확장됩니다.

구체적인 샘플링 방법의 예: 연못에 있는 물고기의 수를 알고 싶다면 먼저 N마리의 물고기를 추출하고 표시한 후 다시 연못에 넣을 수 있습니다.

반복 샘플링을 수행하고 M회 추첨하고 매번 N개의 물고기를 추첨하여 매번 표시가 있는 물고기의 비율을 조사하고 M회의 비율을 기준으로 통계를 계산합니다.

부트스트랩을 적용하는 이유: 사실 분석을 할 때 가장 먼저 하는 일은 확률변수의 종류를 파악한 다음, 확률변수의 데이터가 어떤 분포를 따르는지 파악하는 것입니다. 어떤 분포가 분석 가능한지 직접적으로 결정하기 때문에 매우 중요합니다. 예: 분산 분석을 수행하는 경우 먼저 정규 분포가 필요합니다. 정규 분포가 아닌 경우 교정 조치를 취해야 합니다. 부트스트랩은 또 다른 용도도 있습니다. 고전적인 통계는 중심 경향에는 상대적으로 완벽하지만 중앙값, 사분위수, 표준 편차, 변동 계수 등과 같은 일부 다른 분포 매개변수의 간격 추정에는 완벽하지 않기 때문에 부트스트랩이 필요합니다. . 이 방법. 부트스트랩은 일반적으로 비모수적 방법보다 모수적 방법이 더 효율적입니다. 그러나 모수적 방법의 가장 큰 단점은 모델이 이를 따르지 않는 경우 사전에 분포 모델이 필요하다는 것입니다. 이를 사용하면 분석 결과가 잘못될 수 있으며, 이는 백색 분석입니다.

데이터에 명백한 레이어가 있는 경우 계층화 샘플링을 사용하여 분석 효율성을 높일 수 있습니다. Spss는 기본적으로 비모수적 부트스트랩 방법을 사용하고 완전 무작위 샘플링을 사용합니다. 따라서 계층화 샘플링이 필요한 경우 기본값을 사용할 수 없습니다. 직접 설정해야 합니다.

가장 과학적이고 합리적이기 위해서는 얼마나 많은 관찰이 필요한지에도 특별한 주의가 필요합니다. 답은 1,000입니다. 이 숫자보다 작으면 백분위수법에 따라 신뢰구간을 계산하기 때문에 계산 결과가 정확하지 않으므로 너무 작을 수는 없습니다. 1000개 이상이면 대부분의 경우 정확도 향상이 매우 제한되며 시스템 리소스와 컴퓨팅 시간이 낭비됩니다.

부트스트랩의 spss 분석 작업 단계: "분석" ~ "평균 비교" ~ "평균" ~ 독립변수 및 종속변수 선택 ~ "옵션" 하위 대화 상자 ~ "셀 통계" ~ 부트스트랩 하위 대화 상자 ~실행 bootstrap checkbox

한 가지 더, 종속변수가 정규분포를 따르거나 대략 일치한다면 부트스트랩 방법을 사용할 필요가 없습니다.

위 내용은 부트스트랩 방법은 무엇을 의미하나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.