自举法bootstrap是什么意思?
自举法bootstrap是非参数统计中一种重要的估计统计量方差进而进行区间估计的统计方法。
bootstrap法是指用原样本自身的数据抽样得出新的样本及统计量, 可以译成“自举”法吧,有的认为可译为:自抽样法。也就是通过既有样本生成更多有用的信息的做法。
“直观上就是:在已知数据的基础上, 通过用计算机来模拟N趋近于无穷大时候的情况, 把已知的DATA不断的重新SAMPLING, 从而在新的数据中得出原始数据的信息。再说的更简单更直观就是: 就是给你100个数据, 但是你觉得100个数据没办法真实反映样本的全貌, 你就把这100个数据重新随机的SAMPLE1000次, 这样你就有了100*1000个数据点了. 你的样本量就会增大很多。”
Bootstrap的思想,是生成一系列bootstrap伪样本,每个样本是初始数据有放回抽样。通过对伪样本的计算,获得统计量的分布。例如,要进行1000次bootstrap,求平均值的置信区间 ,可以对每个伪样本计算平均值。这样就获得了1000个平均值。对着1000个平均值的分位数进行计算, 即可获得置信区间。已经证明,在初始样本足够大的情况下,bootstrap抽样能够无偏得接近总体的分布。
Atas ialah kandungan terperinci 自举法bootstrap是什么意思. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!