Maison >développement back-end >Tutoriel Python >Comment effectuer un test t sur un échantillon en Python ?
One Sample T-Test est un test d'hypothèse statistique utilisé pour déterminer si la moyenne de la population est significativement différente de la valeur hypothétique. Python nous fournit les ressources dont nous avons besoin pour effectuer ce test. Dans cet article, nous expliquerons comment effectuer un test t sur un échantillon en Python à l'aide de la bibliothèque SciPy.
La première étape de la réalisation d'un test T sur un échantillon consiste à énoncer l'hypothèse nulle et l'hypothèse alternative. L'hypothèse nulle est l'hypothèse selon laquelle la moyenne de la population est égale à la valeur hypothétique. L’hypothèse alternative est à l’opposé de l’hypothèse nulle, c’est-à-dire que la moyenne de la population n’est pas égale à la valeur hypothétique.
En supposant que nous disposons d'un ensemble de données et d'une valeur hypothétique pour la moyenne de la population, nous pouvons effectuer un test T sur un échantillon pour déterminer si la moyenne de la population est significativement différente de la valeur hypothétique. Voici les étapes pour effectuer un test T sur un échantillon. T-Test en Python utilisant la bibliothèque SciPy −
L'importation des bibliothèques essentielles sera la première étape. Pour effectuer le One Sample T-Test en Python, nous devons importer les bibliothèques NumPy et SciPy. Alors que les opérations statistiques sont effectuées à l'aide de la bibliothèque SciPy, les opérations mathématiques sont effectuées à l'aide de la bibliothèque SciPy. Bibliothèque NumPy.
import numpy as np from scipy.stats import ttest_1samp
Les données doivent ensuite être chargées dans Python. Nous pouvons utiliser la méthode loadtxt() du module NumPy pour nous aider. Le nom du fichier est passé en paramètre à la fonction loadtxt(), qui génère un tableau contenant le contenu.
data = np.loadtxt('data.txt')
Nous devons préciser une valeur hypothétique pour la moyenne de la population. Cette valeur servira de référence pour évaluer si la moyenne de la population s’écarte significativement de l’estimation.
hypothesized_value = 50
Nous sommes maintenant prêts à exécuter le test T One Sample. La fonction ttest_1samp() de la bibliothèque SciPy peut être utilisée pour exécuter le test T One Sample. Les données et la valeur hypothétique sont les deux arguments requis par la fonction ttest_1samp(). .
t_statistic, p_value = ttest_1samp(data, hypothesized_value)
La statistique du test et la valeur p sont les résultats de la fonction ttest_1samp(). La statistique t calcule l'erreur type de la variance de la moyenne de l'échantillon sous une valeur hypothétique. Sous l’hypothèse nulle, la valeur p est la probabilité de générer une statistique t aussi sévère que la statistique observée.
Enfin, nous devons interpréter les résultats d’un test T sur un échantillon. Nous pouvons accomplir cette tâche en comparant les valeurs p et les niveaux de signification. Le niveau de signification est la valeur critique pour rejeter l’hypothèse nulle. Si la valeur p est inférieure à 0,05, qui est le niveau de signification traditionnel, alors l'hypothèse nulle sera rejetée.
if p_value <r; 0.05: print('Reject Null Hypothesis') else: print('Fail to Reject Null Hypothesis')
Si la valeur p est inférieure à 0,05, nous rejetons l'hypothèse nulle et concluons que la moyenne de la population est significativement différente de la valeur hypothétique. Si la valeur p est supérieure ou égale à 0,05, nous ne parvenons pas à rejeter l’hypothèse nulle et concluons que la moyenne de la population n’est pas significativement différente de la valeur hypothétique.
Le test T sur un échantillon suppose que les données suivent une distribution normale, ce qui est important. Si les données ne suivent pas une distribution normale, nous devrons peut-être utiliser un test statistique différent, tel que le test de rang signé de Wilcoxon. Le test T sur un échantillon suppose également que les données sont indépendantes et tirées au hasard de la population. Si certaines hypothèses ne sont pas remplies, les résultats des tests peuvent être inexacts.
Voici un exemple d'exécution d'un test t sur un échantillon en Python à l'aide de la bibliothèque SciPy -
Disons que nous disposons d'un ensemble d'informations qui incluent le poids d'un échantillon de pommes. Nous souhaitons déterminer si le poids moyen des pommes de la population s'écarte de manière significative de 100 grammes. En utilisant Python, nous pouvons effectuer un test T sur un échantillon comme suit :
import numpy as np from scipy.stats import ttest_1samp # Load the data data = np.array([98, 102, 95, 105, 99, 101, 97, 103, 100, 98]) # Define the hypothesized value hypothesized_value = 100 # Perform the One Sample T-Test t_statistic, p_value = ttest_1samp(data, hypothesized_value) # Interpret the results if p_value < 0.05: print('Reject Null Hypothesis') else: print('Fail to Reject Null Hypothesis')
Fail to Reject Null Hypothesis
Étant donné que la valeur p dans ce cas est supérieure à 0,05, nous ne pouvons pas exclure l'hypothèse nulle. Nous concluons qu'au niveau de signification de 0,05, il n'y a pas de différence entre le poids moyen des pommes de la population et celui de 100 grammes.
En résumé, effectuer un test t sur un échantillon en Python est assez simple. La bibliothèque SciPy nous fournit les outils dont nous avons besoin pour réaliser ce test. Importez simplement vos données, fournissez les valeurs de votre hypothèse, exécutez un test t sur un échantillon à l'aide de la fonction ttest_1samp() et comparez les valeurs p au niveau de signification pour interpréter les résultats. Ces étapes nous permettent d'évaluer si la moyenne de la population est significativement différente de la valeur hypothétique.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!