Bootstrap是非參數統計中一種重要的估計統計量變異性,並可進行統計量區間估計的統計方法,也稱為自助法。
其核心思想與基本步驟如下:(推薦學習:Bootstrap影片教學)
(1) 採用重複抽樣技術從原始樣本中抽取一定數量(可自行給定,一般與原始樣本相同)的樣本,此過程允許重複抽樣。
(2) 根據抽出的樣本計算待估計的統計量T。
(3) 重複上述N次(一般大於1000),得到N統計量T。
(4) 計算上述N個統計量T的樣本方差,以此估計統計量T的變異數。
應該說Bootstrap是現代統計學較為流行的統計方法,在小樣本時效果很好。透過方差的估計可以建構信賴區間等,其應用範圍進一步延伸。
具體抽樣方法舉例:想要知道池塘裡面魚的數量,可以先抽取N條魚,做上記號,放回池塘。
進行重複抽樣,抽取M次,每次抽取N條,考察每次抽到的魚當中有記號的比例,綜合M次的比例,在進行統計量的計算。
如果資料存在明顯的層次,可以用分層抽樣提高分析效率,spss默認是非參數bootstrap方法,並且採用完全隨機抽樣,所以,如果要求分層抽樣,不能依靠默認,需要自己設置。
還有特別要注意,需要多少個觀測量才是最科學,最合理的,答案是1000個。少於這個數字,計算結果不準確,因為是依照百分位數法計算可信區間,所以,不能太少。如果多於1000個,多數情況下精度改善非常有限,並且浪費系統資源和計算時間。
bootstrap的spss分析中的操作步驟:「分析」~「比較平均值」~「平均值」~選擇好自變數和因變數~「選項」子對話方塊~「儲存格統計量」~ bootstrap子對話框~執行bootstrap複選框
還有一點,如果因變數符合或大概符合常態分佈,bootstrap方法就可以不用。
更多Bootstrap相關技術文章,請造訪Bootstrap教學欄位進行學習!
以上是bootstrap演算法是什麼意思的詳細內容。更多資訊請關注PHP中文網其他相關文章!