Heim > Artikel > Backend-Entwicklung > Python-Programm zur Berechnung der Standardabweichung
In diesem Artikel erfahren Sie, wie Sie ein Python-Programm implementieren, um die Standardabweichung eines Datensatzes zu berechnen.
Betrachten Sie eine Reihe von Werten, die auf einer beliebigen Achse aufgetragen sind. Die Standardabweichung dieser Wertemengen wird als Grundgesamtheit bezeichnet und ist als Variation zwischen ihnen definiert. Wenn die Standardabweichung gering ist, liegen die aufgetragenen Werte näher am Mittelwert. Ist die Standardabweichung jedoch höher, liegen die Werte weiter vom Mittelwert entfernt.
Es wird durch die Quadratwurzel der Varianz des Datensatzes dargestellt. Es gibt zwei Arten von Standardabweichungen -
Die Populationsstandardabweichung wird aus jedem Datenwert der Population berechnet. Daher handelt es sich um einen festen Wert. Die mathematische Formel ist wie folgt definiert:
$$mathrm{SD:=:sqrt{frac{sum(X_i:-:X_m)^2}{n}}}$$
Wo,
(Wo)Xm ist der Mittelwert des Datensatzes.
Xi sind Elemente des Datensatzes.
n ist die Anzahl der Elemente im Datensatz.
Die Stichprobenstandardabweichung ist jedoch eine Statistik, die nur für bestimmte Datenwerte einer Grundgesamtheit berechnet wird, sodass ihr Wert von der ausgewählten Stichprobe abhängt. Die mathematische Formel ist wie folgt definiert: −
$$mathrm{SD:=:sqrt{frac{sum(X_i:-:X_m)^2}{n:-:1}}}$$
Wo,
(Wo)Xm ist der Mittelwert des Datensatzes.
Xi sind Elemente des Datensatzes.
n ist die Anzahl der Elemente im Datensatz.
Schauen wir uns nun einige Eingabe- und Ausgabeszenarien für verschiedene Datensätze an -
Angenommen, der Datensatz enthält nur positive ganze Zahlen -
Input: [2, 3, 4, 1, 2, 5] Result: Population Standard Deviation: 1.3437096247164249 Sample Standard Deviation: 0.8975274678557505
Angenommen, der Datensatz enthält nur negative ganze Zahlen -
Input: [-2, -3, -4, -1, -2, -5] Result: Population Standard Deviation: 1.3437096247164249 Sample Standard Deviation: 0.8975274678557505
Angenommen, der Datensatz enthält nur positive und negative ganze Zahlen -
Input: [-2, -3, -4, 1, 2, 5] Result: Population Standard Deviation: 3.131382371342656 Sample Standard Deviation: 2.967415635794143
Wir haben die Formel für die Standardabweichung im selben Artikel gesehen. Schauen wir uns nun die Implementierung der mathematischen Formel für verschiedene Datensätze mithilfe eines Python-Programms an.
Im folgenden Beispiel importieren wir die Bibliothek math und berechnen die Standardabweichung eines Datensatzes und seine Varianz, indem wir die integrierte Funktion sqrt() anwenden.
import math #declare the dataset list dataset = [2, 3, 4, 1, 2, 5] #find the mean of dataset sm=0 for i in range(len(dataset)): sm+=dataset[i] mean = sm/len(dataset) #calculating population standard deviation of the dataset deviation_sum = 0 for i in range(len(dataset)): deviation_sum+=(dataset[i]- mean)**2 psd = math.sqrt((deviation_sum)/len(dataset)) #calculating sample standard deviation of the dataset ssd = math.sqrt((deviation_sum)/len(dataset) - 1) #display output print("Population standard deviation of the dataset is", psd) print("Sample standard deviation of the dataset is", ssd)
Die erhaltene Ausgabestandardabweichung ist wie folgt -
Population Standard Deviation of the dataset is 1.3437096247164249 Sample standard deviation of the dataset is 0.8975274678557505
numpy-Modul und verwenden einfach die Funktion numpy.std(), um die Populationsstandardabweichung der Elemente eines numpy-Arrays zu berechnen. Beispiel
Implementieren Sie das folgende Python-Programm, um die Standardabweichung von Numpy-Array-Elementen zu berechnen -import numpy as np #declare the dataset list dataset = np.array([2, 3, 4, 1, 2, 5]) #calculating standard deviation of the dataset sd = np.std(dataset) #display output print("Population standard deviation of the dataset is", sd)
Standardabweichung wird als folgende Ausgabe angezeigt -
Population Standard Deviation of the dataset is 1.3437096247164249
stdev()
undstdev() und pstdev(), um die Standardabweichung eines Beispieldatensatzes zu berechnen. Die Funktion stdev() in Python berechnet nur die Stichprobenstandardabweichung, während die Funktion pstdev() die Grundgesamtheitsstandardabweichung berechnet. Die Parameter und Rückgabetypen der beiden Funktionen sind gleich.
Beispiel 1: Verwendung der Funktion stdev()Das Python-Programm, das die Verwendung der Funktion
import statistics as st #declare the dataset list dataset = [2, 3, 4, 1, 2, 5] #calculating standard deviation of the dataset sd = st.stdev(dataset) #display output print("Standard Deviation of the dataset is", sd)Ausgabe Die Stichprobenstandardabweichung des als Ausgabe erhaltenen Datensatzes ist wie folgt -
Standard Deviation of the dataset is 1.4719601443879744
Das Python-Programm, das zeigt, wie man die Funktion
import statistics as st #declare the dataset list dataset = [2, 3, 4, 1, 2, 5] #calculating standard deviation of the dataset sd = st.pstdev(dataset) #display output print("Standard Deviation of the dataset is", sd)Ausgabe Die Stichprobenstandardabweichung des als Ausgabe erhaltenen Datensatzes ist wie folgt -
Standard Deviation of the dataset is 1.3437096247164249
Das obige ist der detaillierte Inhalt vonPython-Programm zur Berechnung der Standardabweichung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!