Maison >Problème commun >Que signifie l'algorithme d'amorçage ?
Le bootstrap est une méthode statistique importante dans les statistiques non paramétriques qui estime la variabilité des statistiques et peut estimer l'intervalle des statistiques. Elle est également appelée méthode bootstrap.
Les idées de base et les étapes de base sont les suivantes : (apprentissage recommandé : Tutoriel vidéo Bootstrap)
(1) Utiliser la technologie d'échantillonnage répété pour extraire un certain nombre d'échantillons (peuvent être donnés par vous-même, généralement les mêmes que l'échantillon original) de l'échantillon original. Ce processus permet un échantillonnage répété.
(2) Calculer la statistique T à estimer sur la base des échantillons extraits.
(3) Répétez les N fois ci-dessus (généralement supérieures à 1000) pour obtenir N statistiques T.
(4) Calculez la variance de l'échantillon des N statistiques T ci-dessus pour estimer la variance de la statistique T.
Il faut dire que Bootstrap est une méthode statistique populaire dans les statistiques modernes et qu'elle fonctionne bien lorsque l'on travaille avec de petits échantillons. Des intervalles de confiance peuvent être construits grâce à l'estimation de la variance, et leur champ d'application est encore étendu.
Exemple de méthode de prélèvement spécifique : Si vous souhaitez connaître le nombre de poissons dans l'étang, vous pouvez d'abord extraire N poissons, les marquer, et les remettre dans l'étang.
Effectuez des échantillonnages répétés, dessinez M fois et dessinez N poissons à chaque fois. Examinez la proportion de poissons marqués à chaque fois et calculez les statistiques en fonction de la proportion de M fois.
S'il y a des couches évidentes dans les données, vous pouvez utiliser un échantillonnage stratifié pour améliorer l'efficacité de l'analyse. Spss utilise par défaut la méthode bootstrap non paramétrique et utilise un échantillonnage complètement aléatoire. Par conséquent, si vous avez besoin d'un échantillonnage stratifié, vous pouvez le faire. Vous ne pouvez pas compter sur la valeur par défaut et devez la définir vous-même.
Il faut également accorder une attention particulière au nombre d'observations nécessaires pour être le plus scientifique et raisonnable. La réponse est 1 000. S'il est inférieur à ce nombre, le résultat du calcul sera inexact car l'intervalle de confiance est calculé selon la méthode du percentile, il ne peut donc pas être trop petit. S’il y en a plus de 1 000, l’amélioration de la précision est très limitée dans la plupart des cas, et les ressources système et le temps de calcul sont gaspillés.
Étapes de fonctionnement dans l'analyse spss de bootstrap : "Analyse" ~ "Comparer les moyennes" ~ "Moyennes" ~ Sélectionnez la variable indépendante et la variable dépendante ~ Sous-boîte de dialogue "Options" ~ "Statistiques de cellule" ~ sous-boîte de dialogue bootstrap box ~ Case à cocher Exécuter le bootstrap
Un autre point est que si la variable dépendante est conforme ou approximativement conforme à la distribution normale, la méthode bootstrap n'a pas besoin d'être utilisée.
Pour des articles plus techniques liés à Bootstrap, veuillez visiter la colonne Tutoriel Bootstrap pour apprendre !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!