Maison >Problème commun >Qu'est-ce que le test bootstrap

Qu'est-ce que le test bootstrap

藏色散人
藏色散人original
2019-07-31 14:02:2920898parcourir

Qu'est-ce que le test bootstrap

Qu'est-ce que le test bootstrap ?

Le test bootstrap est le test de la méthode bootstrap, qui est l'échantillonnage de remplacement méthode statistique En échantillonnant à plusieurs reprises l'ensemble de données plusieurs fois, plusieurs arbres évolutifs sont construits pour vérifier la crédibilité de branchement d'un arbre donné.

Introduction au bootstrapping

Un arbre génétique est une estimation du véritable modèle de relations évolutives dans un ensemble de séquences. On dit qu'un arbre génétique est une estimation. car il existe une variation aléatoire dans le nombre de substitutions, donc le véritable arbre génétique est inconnu. On peut s'attendre à ce que dans l'arbre génétique, les branches courtes soient moins fiables que les branches longues.

Alors, quels critères peuvent être utilisés. pour évaluer un certain arbre génétique ? Qu'en est-il de la fiabilité d'un ordre de branchement particulier ? Par exemple, dans la figure 17.1C, ces données peuvent-elles réellement séparer la lignée Mo/Ha d'un ancêtre commun qui a précédé la lignée Hu/Ba/Co/Sh ? ?

Quest-ce que le test bootstrap

Une méthode courante pour évaluer la fiabilité d'un nœud dans un arbre génétique est appelée bootstrapping. Dans cette méthode, les sites sont sélectionnés au hasard et construits à partir de données réelles. 1 000 ensembles de données différents ou plus. L'échantillonnage bootstrap est effectué avec un échantillonnage de remplacement, ce qui signifie que le même locus peut être sélectionné

deux fois ou plus par hasard. Par conséquent, un échantillon bootstrap à partir de la séquence de la figure 17.1A est. un échantillon de 50 sites sélectionnés au hasard avec remplacement. Dans un échantillon bootstrap spécifique d'une capacité de 50, 18 sites devraient apparaître une fois, 9 sites apparaîtront deux fois, 5 sites apparaîtront 3 fois ou plus et 18 sites

n'apparaîtra pas du tout. Par conséquent, si dans l'arbre génétique une certaine méthode de branchement est prise en charge par la plupart des sites de la séquence, alors l'arbre génétique obtenu à partir de la plupart des échantillons bootstrap contiendra la même méthode de branchement, mais si le nombre de sites prenant en charge une certaine méthode de branchement est relativement petit, alors l'arbre génétique dérivé des arbres génétiques de nombreux échantillons bootstrap n'inclura pas ce modèle de branchement.

Dans l'arbre génétique de la figure 17.1C, sur 1000 bootstrap échantillons, moins de 50 échantillons soutiennent l’ordre de ramification inclus dans la zone ombrée. En pratique, ce résultat indique que, pour ce petit segment de la protéine, les taxons Hu/Ba, Co/Sh et Mo/Ha se sont séparés en %. des temps très proches, et la question de savoir quel taxon s'est séparé en premier ne peut être résolue.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn