bootstrap演算法是什麼
Bootstrapping演算法,指的就是利用有限的樣本資料經由多次重複抽樣,重新建立起足以代表母體樣本分佈的新樣本。 bootstrapping的運用是基於許多統計假設,因此採樣的準確性會影響假設的成立與否。
統計學中,bootstrapping可以指依賴重置隨機抽樣的一切試驗。 bootstrapping可以用來計算樣本估計的準確性。對於一個採樣,我們只能計算出某個統計量(例如平均數)的一個取值,無法知道平均數統計量的分佈。但是透過自助法(自舉法)我們可以模擬出平均值統計量的近似分佈。有了分佈很多事情就可以做了(比如說有你推出的結果來進而推測實際總體的情況)。
bootstrapping方法的實作很簡單,假設抽取的樣本大小為n:
在原始樣本中有放回的抽樣,抽取n次。每抽一次形成一個新的樣本,重複操作,形成許多新樣本,透過這些樣本就可以計算出樣本的一個分佈。新樣本的數量通常是1000-10000。如果計算成本很小,或對精度要求比較高,就會增加新樣本的數量。
優點:簡單又容易操作。
缺點:bootstrapping的運用是基於許多統計假設,因此假設的成立與否會影響取樣的準確性。
以上是bootstrap演算法是什麼的詳細內容。更多資訊請關注PHP中文網其他相關文章!