Maison > Article > développement back-end > Programme Python pour calculer l'écart type
Dans cet article, nous apprendrons comment implémenter un programme Python pour calculer l'écart type d'un ensemble de données.
Considérons un ensemble de valeurs tracées sur un axe arbitraire. L' écart type de ces ensembles de valeurs est appelé la population et est définie comme la variation entre elles. Si l'écart type est faible, les valeurs tracées seront plus proches de la moyenne. Mais si l’écart type est plus élevé, les valeurs seront plus éloignées de la moyenne.
Il est représenté par la racine carrée de la variance de l'ensemble de données. Il existe deux types d'écart type -
L'écart type de la population est calculé à partir de chaque valeur de données de la population. Il s’agit donc d’une valeur fixe. La formule mathématique est définie comme suit -
$$mathrm{SD:=:sqrt{frac{sum(X_i:-:X_m)^2}{n}}}$$
Où,
(Où)Xm est la moyenne de l'ensemble de données.
Xi sont des éléments de l'ensemble de données.
n est le nombre d'éléments dans l'ensemble de données.
Cependant, Écart type de l'échantillon est une statistique calculée uniquement pour certaines valeurs de données d'une population, sa valeur dépend donc de l'échantillon choisi. La formule mathématique est définie comme suit −
$$mathrm{SD:=:sqrt{frac{sum(X_i:-:X_m)^2}{n:-:1}}}$$
Où,
(Où)Xm est la moyenne de l'ensemble de données.
Xi sont des éléments de l'ensemble de données.
n est le nombre d'éléments dans l'ensemble de données.
Examinons maintenant quelques scénarios d'entrée et de sortie pour différents ensembles de données -
Supposons que l'ensemble de données ne contienne que des entiers positifs -
Input: [2, 3, 4, 1, 2, 5] Result: Population Standard Deviation: 1.3437096247164249 Sample Standard Deviation: 0.8975274678557505
Supposons que l'ensemble de données ne contienne que des entiers négatifs -
Input: [-2, -3, -4, -1, -2, -5] Result: Population Standard Deviation: 1.3437096247164249 Sample Standard Deviation: 0.8975274678557505
Supposons que l'ensemble de données ne contienne que des entiers positifs et négatifs -
Input: [-2, -3, -4, 1, 2, 5] Result: Population Standard Deviation: 3.131382371342656 Sample Standard Deviation: 2.967415635794143
Nous avons vu la formule de l'écart type dans le même article ; voyons maintenant comment implémenter la formule mathématique sur divers ensembles de données à l'aide d'un programme Python.
Dans l'exemple ci-dessous, nous importons la bibliothèque math et calculons l'écart type d'un ensemble de données et sa variance en appliquant la fonction intégrée sqrt().
import math #declare the dataset list dataset = [2, 3, 4, 1, 2, 5] #find the mean of dataset sm=0 for i in range(len(dataset)): sm+=dataset[i] mean = sm/len(dataset) #calculating population standard deviation of the dataset deviation_sum = 0 for i in range(len(dataset)): deviation_sum+=(dataset[i]- mean)**2 psd = math.sqrt((deviation_sum)/len(dataset)) #calculating sample standard deviation of the dataset ssd = math.sqrt((deviation_sum)/len(dataset) - 1) #display output print("Population standard deviation of the dataset is", psd) print("Sample standard deviation of the dataset is", ssd)
L'écart type de sortie obtenu est le suivant -
Population Standard Deviation of the dataset is 1.3437096247164249 Sample standard deviation of the dataset is 0.8975274678557505
Dans cette approche, nous importons le module numpy et utilisons simplement la fonction numpy.std() pour calculer l'écart type de population des éléments d'un tableau numpy .
Implémentez le programme python suivant pour calculer l'écart type des éléments du tableau numpy -
import numpy as np #declare the dataset list dataset = np.array([2, 3, 4, 1, 2, 5]) #calculating standard deviation of the dataset sd = np.std(dataset) #display output print("Population standard deviation of the dataset is", sd)
L'écart type est affiché comme le résultat suivant -
Population Standard Deviation of the dataset is 1.3437096247164249
Statistiques de Python fournit des fonctions nommées stdev() et pstdev() pour calculer l'écart type d'un exemple d'ensemble de données. La fonction stdev() en Python calcule uniquement l'écart type de l'échantillon, tandis que la fonction pstdev() calcule l'écart type de la population.
Les paramètres et les types de retour des deux fonctions sont les mêmes.
Le programme Python démontrant l'utilisation de la fonction stdev() pour calculer l'écart type d'un échantillon d'un ensemble de données est le suivant −
import statistics as st #declare the dataset list dataset = [2, 3, 4, 1, 2, 5] #calculating standard deviation of the dataset sd = st.stdev(dataset) #display output print("Standard Deviation of the dataset is", sd)
L'exemple d'écart type de l'ensemble de données obtenu en sortie est le suivant -
Standard Deviation of the dataset is 1.4719601443879744
Le programme python qui montre comment utiliser la fonction pstdev() pour trouver l'écart type global d'un ensemble de données est le suivant -
import statistics as st #declare the dataset list dataset = [2, 3, 4, 1, 2, 5] #calculating standard deviation of the dataset sd = st.pstdev(dataset) #display output print("Standard Deviation of the dataset is", sd)
L'exemple d'écart type de l'ensemble de données obtenu en sortie est le suivant -
Standard Deviation of the dataset is 1.3437096247164249
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!