Le test Bootstrap estime la distribution d'échantillonnage et évalue sa signification statistique en échantillonnant et en calculant des statistiques à plusieurs reprises. Les étapes comprennent : un échantillonnage aléatoire à partir des données originales avec remplacement. Calculez les statistiques et répétez plusieurs fois. Créez des échantillons bootstrapés et des distributions d’échantillonnage de statistiques. Calculez la valeur P, qui mesure la probabilité de tomber sur une statistique observée ou une valeur plus extrême. Plus la valeur P est petite, plus la signification statistique est élevée : Valeur P
Test Bootstrap
Le Bootstrap Le test est une méthode statistique utilisée pour évaluer la distribution d’échantillonnage d’une statistique afin de déterminer si elle est statistiquement significative. Voici les étapes du test Bootstrap :
-
Tirez un échantillon de l'ensemble de données d'origine : Tirez au hasard un échantillon de la taille de l'ensemble de données d'origine à partir de l'ensemble de données d'origine avec remplacement. Autrement dit, les éléments extraits peuvent apparaître de manière répétée dans l’échantillon.
-
Calculer des statistiques : Calculez des statistiques d'intérêt, telles que la moyenne, la médiane ou l'écart type, sur les échantillons prélevés.
-
Répétez les étapes 1 et 2 : Répétez les étapes 1 et 2 plusieurs fois pour créer de nombreux échantillons et calculer les statistiques correspondantes. Ces échantillons sont appelés échantillons bootstrapés et les statistiques calculées sont appelées statistiques bootstrapées.
-
Créer une distribution d'échantillonnage : Regroupez les statistiques bootstrapées pour créer une distribution d'échantillonnage. La distribution d'échantillonnage montre comment une statistique changera si vous répétez l'échantillonnage et le calcul de la statistique plusieurs fois.
-
Calculer la valeur P : La valeur P est la probabilité de tomber sur la statistique observée ou sur une statistique plus extrême. Plus la valeur P est petite, plus on soupçonne que la statistique observée a été produite par échantillonnage aléatoire.
La valeur P expliquée
La valeur P est souvent utilisée comme mesure de signification statistique. Selon les seuils communément acceptés, les valeurs P :
- Valeur P sont considérées comme statistiquement significatives, ce qui indique qu'il est peu probable que la statistique observée résulte d'un échantillonnage aléatoire.
-
0,05 <= Valeur P <0,1 : Considéré comme proche de la signification, mais la signification statistique ne peut pas être clairement déterminée.
-
Valeur P >= 0,1 : est considérée comme non significative, indiquant que la statistique observée peut être générée par échantillonnage aléatoire.
Il est à noter que le test Bootstrap est une méthode d'échantillonnage, et ses résultats dépendent de l'échantillon Bootstrapped. Par conséquent, le test Bootstrap n’est pas toujours tout à fait précis, mais il peut généralement fournir une bonne estimation de la distribution d’échantillonnage de la statistique.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!
Déclaration:Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn