Maison >Problème commun >Que signifie la méthode bootstrap ?

Que signifie la méthode bootstrap ?

藏色散人
藏色散人original
2019-07-16 10:52:287463parcourir

Que signifie la méthode bootstrap ?

Que signifie la méthode bootstrap

La méthode bootstrap est une estimation importante de la variabilité statistique dans les non- statistiques paramétriques. Il s'agit également d'une méthode statistique permettant d'estimer l'intervalle de quantités statistiques, également connue sous le nom de méthode bootstrap.

L'idée principale et les étapes de base sont les suivantes :

(1) Utiliser la technologie d'échantillonnage répété pour extraire un certain nombre d'échantillons de l'échantillon d'origine (peut être donné par vous-même, généralement le même comme l'échantillon original), ce processus permet un échantillonnage répété.

(2) Calculer la statistique T à estimer sur la base des échantillons extraits.

(3) Répétez les N fois ci-dessus (généralement supérieures à 1000) pour obtenir N statistiques T.

(4) Calculez la variance de l'échantillon des N statistiques T ci-dessus pour estimer la variance de la statistique T.

Il faut dire que Bootstrap est une méthode statistique populaire dans les statistiques modernes et qu'elle fonctionne bien lorsque l'on travaille avec de petits échantillons. Des intervalles de confiance peuvent être construits grâce à l'estimation de la variance, et leur champ d'application est encore étendu.

Exemple de méthode de prélèvement spécifique : Si vous souhaitez connaître le nombre de poissons dans l'étang, vous pouvez d'abord extraire N poissons, les marquer, et les remettre dans l'étang.

Effectuez des échantillonnages répétés, tirez M fois et tirez N poissons à chaque fois. Vérifiez la proportion de poissons marqués parmi les poissons tirés à chaque fois et calculez les statistiques en fonction de la proportion de M fois.

Raisons d'appliquer le bootstrap : En fait, lors d'une analyse, la première chose à faire est de déterminer le type de variable aléatoire, puis de déterminer à quelle distribution obéissent les données de la variable aléatoire. La répartition est cruciale, car elle détermine directement si elle peut être analysée. Par exemple : si vous effectuez une analyse de variance, vous devez d'abord exiger une distribution normale. S'il ne s'agit pas d'une distribution normale, vous devez prendre des mesures correctives. Cette mesure corrective est le bootstrap. Le bootstrap a également une autre utilité, car les statistiques classiques sont relativement parfaites pour la tendance centrale, mais elles ne sont pas parfaites pour l'estimation par intervalles de certains autres paramètres de distribution, tels que la médiane, les quartiles, l'écart type, le coefficient de variation, etc., le bootstrap est donc nécessaire. .Cette méthode. Bootstrap est similaire à la méthode statistique classique. En général, la méthode paramétrique est plus efficace que la méthode non paramétrique. Cependant, le plus gros inconvénient de la méthode paramétrique est qu'elle nécessite un modèle de distribution au préalable si le modèle n'est pas conforme. avec cela, les résultats de l'analyse peuvent être erronés, ce qui est une analyse blanche.

S'il y a des couches évidentes dans les données, vous pouvez utiliser un échantillonnage stratifié pour améliorer l'efficacité de l'analyse. Spss utilise par défaut la méthode bootstrap non paramétrique et utilise un échantillonnage complètement aléatoire. Par conséquent, si vous avez besoin d'un échantillonnage stratifié, vous pouvez le faire. Vous ne pouvez pas compter sur la valeur par défaut et devez la définir vous-même.

Il faut également accorder une attention particulière au nombre d'observations nécessaires pour être le plus scientifique et raisonnable. La réponse est 1 000. S'il est inférieur à ce nombre, le résultat du calcul sera inexact car l'intervalle de confiance est calculé selon la méthode du percentile, il ne peut donc pas être trop petit. S’il y en a plus de 1 000, l’amélioration de la précision est très limitée dans la plupart des cas, et les ressources système et le temps de calcul sont gaspillés.

Étapes de fonctionnement dans l'analyse spss de bootstrap : "Analyse" ~ "Comparer les moyennes" ~ "Moyennes" ~ Sélectionnez la variable indépendante et la variable dépendante ~ Sous-boîte de dialogue "Options" ~ "Statistiques de cellule" ~ sous-boîte de dialogue bootstrap box ~ Case à cocher Exécuter le bootstrap

Un autre point est que si la variable dépendante est conforme ou approximativement conforme à la distribution normale, la méthode bootstrap n'a pas besoin d'être utilisée.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn