Bootstrap ist eine wichtige statistische Methode in der nichtparametrischen Statistik, die die Variabilität von Statistiken schätzt und das Intervall von Statistiken schätzen kann. Sie wird auch als Bootstrap-Methode bezeichnet.
Die Kernideen und grundlegenden Schritte sind wie folgt: (empfohlenes Lernen: Bootstrap-Video-Tutorial)
(1) Verwenden Sie die Technologie der wiederholten Probenahme, um eine bestimmte Anzahl von Proben (Sie können sie selbst angeben, im Allgemeinen dieselbe wie die Originalprobe) aus der Originalprobe zu extrahieren.
(2) Berechnen Sie die zu schätzende Statistik T basierend auf den extrahierten Proben.
(3) Wiederholen Sie die oben genannten N-mal (im Allgemeinen mehr als 1000), um N Statistiken T zu erhalten.
(4) Berechnen Sie die Stichprobenvarianz der oben genannten N Statistiken T, um die Varianz der Statistik T zu schätzen.
Es sollte gesagt werden, dass Bootstrap eine beliebte statistische Methode in der modernen Statistik ist und bei der Arbeit mit kleinen Stichproben gut funktioniert. Durch die Schätzung der Varianz können Konfidenzintervalle usw. erstellt und der Anwendungsbereich weiter erweitert werden.
Beispiel für eine bestimmte Probenahmemethode: Wenn Sie die Anzahl der Fische im Teich wissen möchten, können Sie zunächst N-Fische entnehmen, sie markieren und wieder in den Teich einsetzen.
Führen Sie wiederholte Probenahmen durch, ziehen Sie M-mal und jedes Mal N-Fische. Überprüfen Sie jedes Mal den Anteil der markierten Fische unter den gezogenen Fischen und berechnen Sie die Statistik basierend auf dem Anteil von M-mal.
Wenn die Daten offensichtliche Schichten enthalten, können Sie die geschichtete Stichprobe verwenden, um die Analyseeffizienz zu verbessern. Wenn Sie also eine geschichtete Stichprobe benötigen, verwendet spss standardmäßig die nichtparametrische Bootstrap-Methode Sie können sich nicht auf die Standardeinstellung verlassen und müssen diese selbst festlegen.
Es muss auch besonders darauf geachtet werden, wie viele Beobachtungen erforderlich sind, um möglichst wissenschaftlich und vernünftig zu sein. Die Antwort ist 1.000. Liegt er unter dieser Zahl, ist das Berechnungsergebnis ungenau, da das Konfidenzintervall nach der Perzentilmethode berechnet wird und daher nicht zu klein sein darf. Bei mehr als 1000 ist die Genauigkeitsverbesserung in den meisten Fällen sehr begrenzt und es werden Systemressourcen und Rechenzeit verschwendet.
Operationsschritte in der SPSS-Analyse von Bootstrap: „Analyse“ ~ „Mittelwerte vergleichen“ ~ „Mittelwerte“ ~ Wählen Sie die unabhängige Variable und die abhängige Variable aus ~ Unterdialog „Optionen“ ~ „Zellenstatistik“ ~ Bootstrap-Unterdialog Feld ~ Kontrollkästchen Bootstrap ausführen
Ein weiterer Punkt ist, dass die Bootstrap-Methode nicht verwendet werden muss, wenn die abhängige Variable der Normalverteilung entspricht oder ungefähr dieser entspricht.
Weitere technische Artikel zu Bootstrap finden Sie in der Spalte Bootstrap-Tutorial.
Das obige ist der detaillierte Inhalt vonWas bedeutet Bootstrap-Algorithmus?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!