Heim >Backend-Entwicklung >Python-Tutorial >Wie führe ich in Python einen T-Test mit zwei Stichproben durch?

Wie führe ich in Python einen T-Test mit zwei Stichproben durch?

王林nach vorne: 2023-08-31 21:49:031638Durchsuche

Einführung

Verwenden Sie einen T-Test mit zwei Stichproben, um zwei Sätze von Mittelwerten statistisch zu vergleichen und festzustellen, ob zwischen ihnen ein signifikanter Unterschied besteht. Dieser Test wird in der wissenschaftlichen Forschung häufig verwendet, um anhand einer kontinuierlichen Variablen festzustellen, ob sich zwei Gruppen signifikant unterscheiden. In diesem Artikel erfahren Sie, wie Sie mit dem scipy.stats-Modul von Python einen T-Test mit zwei Stichproben durchführen.

Führen Sie einen T-Test mit zwei Stichproben durch

Bevor wir mit der Implementierung fortfahren, wollen wir zunächst die theoretischen Grundlagen des Zwei-Stichproben-T-Tests verstehen. Bei diesem Test wird davon ausgegangen, dass die beiden Stichprobenpopulationen normalverteilt sind und ähnliche Varianzen aufweisen. Die Nullhypothese besagt, dass die Mittelwerte der beiden Gruppen gleich sind, und die Alternativhypothese besagt, dass die Mittelwerte der beiden Gruppen nicht gleich sind. Die Teststatistik wird berechnet, indem die Differenz der Mittelwerte zwischen zwei Gruppen durch die Differenz der Standardfehler dividiert wird. Wir lehnen die Nullhypothese ab und kommen zu dem Schluss, dass die Mittelwerte der beiden Gruppen signifikant unterschiedlich sind, wenn der geschätzte t-Wert über dem kritischen Wert liegt.

Sehen wir uns an, wie man einen T-Test mit zwei Stichproben in Python durchführt. Wir benötigen das Modul scipy.stats, das bei der Bereitstellung einer Funktion namens ttest_ind hilft. Als Eingabe werden zwei Arrays verwendet, die zwei Stichproben darstellen, und es werden t- und p-Werte zurückgegeben.

Schritt 1: Importieren Sie die erforderlichen Bibliotheken

Der Import der erforderlichen Bibliotheken ist der erste Schritt. Um einen T-Test mit zwei Stichproben in Python durchzuführen, müssen wir die Bibliotheken NumPy und SciPy importieren. Statistische Operationen wurden mit der SciPy-Bibliothek durchgeführt, während mathematische Operationen mit der NumPy-Bibliothek durchgeführt wurden.

import NumPy as np
from scipy.stats import ttest_ind

Schritt 2: Variablen generieren

Als nächstes erstellen wir zwei Zufallsstichproben mit dem gleichen Mittelwert und der gleichen Standardabweichung -

np.random.seed(42)
sample1 = np.random.normal(loc=10, scale=2, size=100)
sample2 = np.random.normal(loc=10, scale=2, size=100)

Hier verwenden wir die Funktion np.random.normal, um zwei Stichproben der Größe jeweils 100 mit einem Mittelwert von 10 und einer Standardabweichung von 2 zu generieren. Wir setzen den Zufallsstartwert auf 42, um reproduzierbare Ergebnisse sicherzustellen.

Jetzt machen wir den t-Test -

t_stat, p_value = ttest_ind(sample1, sample2)

Schritt 3: Interpretieren Sie die Ergebnisse

Die Funktion

ttest_ind gibt zwei Werte mit Codes zurück: t-Wert und p-Wert. Der t-Wert misst die Differenz zwischen zwei Stichprobenmittelwerten, während der p-Wert die statistische Signifikanz der Differenz misst.

Zum Schluss drucken wir die Ergebnisse aus -

print("t-value: ", t_stat)
print("p-value: ", p_value)

Dadurch werden der t-Wert und der p-Wert ausgegeben -

t-value: 0.086
p-value: 0.931

Da die t-Werte in diesem Code klein sind, können wir daraus schließen, dass die Mittelwerte der beiden Stichproben ziemlich vergleichbar sind. Da der p-Wert zu groß ist, ist der Unterschied zwischen den beiden Werten nicht gleich signifikant.

Denken Sie daran, dass der t-Test davon ausgeht, dass die Varianzen der beiden Gruppen gleich sind. Wenn diese Annahme nicht erfüllt ist, können Sie den Welch-T-Test verwenden, eine Variante des T-Tests, bei der nicht gleiche Varianzen angenommen werden. Die Methode ttest_ind_from_stats für den Welch-T-Test ist auch im Modul scipy.stats verfügbar. Der Mittelwert, die Standardabweichung und die Stichprobengröße der beiden Gruppen sind die Eingaben für diese Funktion.

Sehen wir uns an, wie man den Welch-T-Test in Python durchführt

mean1, std1, size1 = 10, 2, 100
mean2, std2, size2 = 10, 3, 100
t_stat, p_value = ttest_ind_from_stats(mean1, std1, size1, mean2, std2, size2, equal_var=False)
print("t-value: ", t_stat)
print("p-value: ", p_value)

Dadurch werden der t-Wert und der p-Wert ausgegeben -

t-value: -0.267
p-value: 0.790

Den Daten zufolge ist der t-Wert in diesem Beispiel negativ, was darauf hinweist, dass der Mittelwert von Probe 1 etwas niedriger ist als der Mittelwert von Probe 2. Ein sehr hoher p-Wert weist jedoch darauf hin, dass der Mittelwertunterschied statistisch nicht signifikant ist.

Fazit

Zusammenfassend lässt sich sagen, dass der Zwei-Stichproben-T-Test ein wirksames statistisches Tool ist, mit dem wir die Mittelwerte zweier Gruppen vergleichen und feststellen können, ob sie sich signifikant unterscheiden. Python verfügt über viele Bibliotheken und Funktionen zum Durchführen von T-Tests, einschließlich des Moduls scipy.stats, das wir in diesem Artikel verwenden. Der t-Test geht von verschiedenen Annahmen aus, darunter Normalität und gleiche Varianzen, die vor der Durchführung des Tests überprüft werden sollten. Darüber hinaus sollten bei der Interpretation der Ergebnisse immer die spezifische Forschungsfrage, die betrachtet wird, und die Einschränkungen der Studie berücksichtigt werden.

Das obige ist der detaillierte Inhalt vonWie führe ich in Python einen T-Test mit zwei Stichproben durch?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Python numpy scipy

Stellungnahme：

Dieser Artikel ist reproduziert unter:tutorialspoint.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen

Vorheriger Artikel：Speichern Sie API-Daten mit Python im CSV-FormatNächster Artikel：Speichern Sie API-Daten mit Python im CSV-Format

In Verbindung stehende Artikel

Mehr sehen