Heim  >  Artikel  >  Backend-Entwicklung  >  Wie führe ich einen T-Test bei einer Stichprobe in Python durch?

Wie führe ich einen T-Test bei einer Stichprobe in Python durch?

WBOY
WBOYnach vorne
2023-09-17 10:37:021049Durchsuche

Wie führe ich einen T-Test bei einer Stichprobe in Python durch?

Einführung

Ein Stichproben-T-Test ist ein statistischer Hypothesentest, der verwendet wird, um zu bestimmen, ob der Populationsmittelwert signifikant vom hypothetischen Wert abweicht. Python stellt uns die Ressourcen zur Verfügung, die wir zur Durchführung dieses Tests benötigen. In diesem Artikel stellen wir vor, wie man mit der SciPy-Bibliothek einen Ein-Stichproben-T-Test in Python durchführt.

Führen Sie einen Probe-T-Test durch

Der erste Schritt bei der Durchführung eines T-Tests bei einer Stichprobe besteht darin, die Nullhypothese und die Alternativhypothese anzugeben. Die Nullhypothese ist die Annahme, dass der Mittelwert der Grundgesamtheit gleich dem hypothetischen Wert ist. Die Alternativhypothese ist das Gegenteil der Nullhypothese, das heißt, der Mittelwert der Grundgesamtheit ist nicht gleich dem hypothetischen Wert.

Angenommen, wir haben einen Datensatz und einen hypothetischen Wert für den Populationsmittelwert, können wir einen One-Sample-T-Test durchführen, um festzustellen, ob der Populationsmittelwert signifikant vom hypothetischen Wert abweicht. Hier sind die Schritte zur Durchführung eines One-Sample-T-Tests T-Test in Python mit der SciPy-Bibliothek −

Schritt 1: Erforderliche Bibliotheken importieren

Der Import der wesentlichen Bibliotheken ist der erste Schritt, um den One Sample T-Test in Python durchzuführen. Während statistische Operationen mit der SciPy-Bibliothek ausgeführt werden, werden mathematische Operationen mit durchgeführt NumPy-Bibliothek.

import numpy as np
from scipy.stats import ttest_1samp

Schritt 2: Laden Sie die Daten

Die Daten müssen dann in Python geladen werden. Als Hilfe können wir die Methode „loadtxt()“ des NumPy-Moduls verwenden. Der Dateiname wird als Parameter an die Funktion „loadtxt()“ übergeben, die ein Array mit dem Inhalt generiert.

data = np.loadtxt('data.txt')

Schritt 3: Hypothesenwerte definieren

Wir müssen einen hypothetischen Wert für den Bevölkerungsmittelwert angeben. Dieser Wert dient als Grundlage für die Beurteilung, ob der Bevölkerungsmittelwert erheblich von der Schätzung abweicht.

hypothesized_value = 50

Schritt 4: Führen Sie den One Sample T-Test durch

Wir sind jetzt bereit, den One Sample T-Test auszuführen. Die Funktion ttest_1samp() der SciPy-Bibliothek kann zum Ausführen des One Sample T-Tests verwendet werden. Die Daten und der hypothetische Wert sind die beiden Argumente, die die Funktion ttest_1samp() benötigt .

t_statistic, p_value = ttest_1samp(data, hypothesized_value)

Die Teststatistik und der p-Wert sind die Ergebnisse der Funktion ttest_1samp(). Die T-Statistik berechnet den Standardfehler der Varianz des Stichprobenmittelwerts unter einem hypothetischen Wert. Unter der Nullhypothese ist der p-Wert die Wahrscheinlichkeit, eine t-Statistik zu generieren, die genauso schwerwiegend ist wie die beobachtete Statistik.

Schritt 5: Interpretieren Sie die Ergebnisse

Abschließend müssen wir die Ergebnisse eines T-Tests bei einer Stichprobe interpretieren. Wir können diese Aufgabe erfüllen, indem wir p-Werte und Signifikanzniveaus vergleichen. Das Signifikanzniveau ist der kritische Wert für die Ablehnung der Nullhypothese. Wenn der p-Wert kleiner als 0,05 ist, was dem traditionellen Signifikanzniveau entspricht, wird die Nullhypothese abgelehnt.

if p_value <r; 0.05:
   print('Reject Null Hypothesis')
else:
   print('Fail to Reject Null Hypothesis')

Wenn der p-Wert kleiner als 0,05 ist, lehnen wir die Nullhypothese ab und kommen zu dem Schluss, dass der Populationsmittelwert erheblich vom hypothetischen Wert abweicht. Wenn der p-Wert größer oder gleich 0,05 ist, verwerfen wir die Nullhypothese nicht und kommen zu dem Schluss, dass sich der Mittelwert der Grundgesamtheit nicht wesentlich vom hypothetischen Wert unterscheidet.

Der T-Test bei einer Stichprobe geht davon aus, dass die Daten einer Normalverteilung folgen, was wichtig ist. Wenn die Daten keiner Normalverteilung folgen, müssen wir möglicherweise einen anderen statistischen Test verwenden, beispielsweise den Wilcoxon-Signed-Rank-Test. Beim Ein-Stichproben-T-Test wird außerdem davon ausgegangen, dass die Daten unabhängig sind und zufällig aus der Grundgesamtheit gezogen werden. Wenn bestimmte Annahmen nicht erfüllt sind, können die Testergebnisse ungenau sein.

Beispiel mit Code und Ausgabe

Hier ist ein Beispiel für die Durchführung eines T-Tests mit einer Stichprobe in Python mithilfe der SciPy-Bibliothek -

Angenommen, wir verfügen über eine Reihe von Informationen, die das Gewicht einer Apfelprobe umfassen. Wir möchten feststellen, ob das mittlere Apfelgewicht der Population erheblich von 100 Gramm abweicht. Mit Python können wir einen One Sample T-Test wie folgt durchführen

import numpy as np
from scipy.stats import ttest_1samp

# Load the data
data = np.array([98, 102, 95, 105, 99, 101, 97, 103, 100, 98])

# Define the hypothesized value
hypothesized_value = 100

# Perform the One Sample T-Test
t_statistic, p_value = ttest_1samp(data, hypothesized_value)

# Interpret the results
if p_value < 0.05:
   print('Reject Null Hypothesis')
else:
   print('Fail to Reject Null Hypothesis')

Ausgabe

Fail to Reject Null Hypothesis

Da der p-Wert in diesem Fall höher als 0,05 ist, können wir die Nullhypothese nicht ausschließen. Wir kommen zu dem Schluss, dass es bei einem Signifikanzniveau von 0,05 keinen Unterschied zwischen dem durchschnittlichen Gewicht der Äpfel und 100 Gramm gibt.

Fazit

Zusammenfassend lässt sich sagen, dass die Durchführung eines T-Tests bei einer Stichprobe in Python ziemlich einfach ist. Die SciPy-Bibliothek stellt uns die Tools zur Verfügung, die wir zur Durchführung dieses Tests benötigen. Importieren Sie einfach Ihre Daten, geben Sie die Werte für Ihre Hypothese an, führen Sie einen t-Test bei einer Stichprobe mit der Funktion ttest_1samp() durch und vergleichen Sie die p-Werte mit dem Signifikanzniveau, um die Ergebnisse zu interpretieren. Mit diesen Schritten können wir bewerten, ob der Populationsmittelwert signifikant vom hypothetischen Wert abweicht.

Das obige ist der detaillierte Inhalt vonWie führe ich einen T-Test bei einer Stichprobe in Python durch?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:tutorialspoint.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen