Bootstrap是非参数统计中一种重要的估计统计量变异性,并可进行统计量区间估计的统计方法,也称为自助法。
其核心思想和基本步骤如下:(推荐学习:Bootstrap视频教程)
(1) 采用重复抽样技术从原始样本中抽取一定数量(可自己给定,一般与原始样本相同)的样本,此过程允许重复抽样。
(2) 根据抽出的样本计算待估计的统计量T。
(3) 重复上述N次(一般大于1000),得到N个统计量T。
(4) 计算上述N个统计量T的样本方差,以此估计统计量T的方差。
应该说Bootstrap是现代统计学较为流行的一种统计方法,在小样本时效果很好。通过方差的估计可以构造置信区间等,其应用范围得到进一步延伸。
具体抽样方法举例:想要知道池塘里面鱼的数量,可以先抽取N条鱼,做上记号,放回池塘。
进行重复抽样,抽取M次,每次抽取N条,考察每次抽到的鱼当中有记号的比例,综合M次的比例,在进行统计量的计算。
如果数据存在明显的层次,可以用分层抽样提高分析效率,spss默认是非参数bootstrap方法,并且采用完全随机抽样,所以,如果要求分层抽样,不能依靠默认,需要自己设置。
还有特别需要注意,需要多少个观测量才是最科学,最合理的,答案是1000个。少于这个数字,计算结果不准确,因为是按照百分位数法计算可信区间,所以,不能太少。如果多于1000个,多数情况下精度改善非常有限,并且浪费系统资源和计算时间。
bootstrap的spss分析中的操作步骤:“分析”~“比较均值”~“均值”~选择好自变量和因变量~“选项”子对话框~“单元格统计量”~bootstrap子对话框~执行bootstrap复选框
还有一点,如果因变量符合或者大概符合正态分布,bootstrap方法就可以不用。
更多Bootstrap相关技术文章,请访问Bootstrap教程栏目进行学习!
Atas ialah kandungan terperinci bootstrap算法是什么意思. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!