Maison  >  Article  >  qu'est-ce que le bootstrap

qu'est-ce que le bootstrap

(*-*)浩
(*-*)浩original
2019-07-10 14:15:579294parcourir

L'algorithme d'amorçage fait référence à l'utilisation de données d'échantillon limitées pour rééchantillonner plusieurs fois afin de rétablir un nouvel échantillon suffisant pour représenter la distribution de l'échantillon parent.

qu'est-ce que le bootstrapL'application du bootstrapping est basée sur de nombreuses hypothèses statistiques, de sorte que la précision de l'échantillonnage affectera si les hypothèses sont établies ou non. (Apprentissage recommandé : Tutoriel vidéo Bootstrap)

Dans les statistiques, le bootstrapping peut faire référence à toutes les expériences qui reposent sur la réinitialisation d'un échantillonnage aléatoire. Le bootstrapping peut être utilisé pour calculer l’exactitude des estimations d’échantillon. Pour un échantillonnage, nous ne pouvons calculer qu'une seule valeur d'une certaine statistique (telle que la moyenne) et ne pouvons pas connaître la distribution de la statistique moyenne. Mais grâce à la méthode bootstrap (méthode bootstrap), nous pouvons simuler la distribution approximative de la statistique moyenne. Avec la distribution, beaucoup de choses peuvent être faites (par exemple, vous pouvez utiliser les résultats que vous avez dérivés pour déduire la situation globale réelle).

La mise en œuvre de la méthode d'amorçage est très simple. Supposons que la taille de l'échantillon soit n :

Il y a un échantillonnage avec remplacement dans l'échantillon d'origine, et l'échantillon est tiré n fois. Chaque fois qu'un nouvel échantillon est prélevé, l'opération est répétée pour former de nombreux nouveaux échantillons, à travers lesquels une distribution de l'échantillon peut être calculée. Le nombre de nouveaux échantillons est généralement compris entre 1 000 et 10 000. Si le coût de calcul est faible ou si les exigences de précision sont relativement élevées, augmentez le nombre de nouveaux échantillons.

Avantages : Simple et facile à utiliser.

Inconvénients : L'application du bootstrapping est basée sur de nombreuses hypothèses statistiques, donc le fait que les hypothèses soient établies ou non affectera la précision de l'échantillonnage.

Dans l'apprentissage automatique, la méthode Bootstrap fait référence à l'échantillonnage aléatoire avec remplacement, qui est un rééchantillonnage qui permet au modèle ou à l'algorithme de mieux comprendre le biais, la variance et les caractéristiques qui y existent. L'échantillonnage des données permet un rééchantillonnage pour inclure différents biais, puis les englober dans leur ensemble. Comme le montre la figure 1, chaque échantillon de population comporte différentes parties et est différent les uns des autres. Cela affecte ensuite la moyenne globale, l’écart type et d’autres mesures descriptives de l’ensemble de données. À son tour, il peut développer des modèles plus robustes.

Le bootstrapping convient également aux petits ensembles de données qui ont tendance à être surajustés.

La raison d'utiliser Bootstrap est qu'il peut tester la stabilité de la solution. Tester plusieurs modèles à l’aide de plusieurs échantillons d’ensembles de données peut améliorer la robustesse. Peut-être qu'un échantillon d'ensemble de données a une moyenne plus grande que d'autres ensembles de données, ou un écart type différent. Cette approche peut identifier les modèles surajustés et non testés à l'aide d'ensembles de données présentant des variances différentes.

Utilisation de

L'une des raisons pour lesquelles le bootstrapping devient de plus en plus courant est l'augmentation de la puissance de calcul. Il y a plus de réarrangements et de rééchantillonnages qu'auparavant. Le Bagging et le Boosting utilisent Bootstrapping

Pour plus d'articles techniques liés au Bootstrap, veuillez visiter la colonne Tutoriel Bootstrap pour apprendre !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn