Heim >Backend-Entwicklung >Python-Tutorial >So berechnen Sie den P-Wert zweier Datensätze basierend auf Python

So berechnen Sie den P-Wert zweier Datensätze basierend auf Python

coldplay.xixi
coldplay.xixinach vorne
2020-07-16 17:40:466128Durchsuche

So berechnen Sie den P-Wert zweier Datensätze basierend auf Python

Wir müssen p_value verwenden, wenn wir eine A/B-Testauswertung durchführen. In diesem Artikel wird beschrieben, wie Python verwendet wird, um die Signifikanz zweier Datensätze zu berechnen.

1. Code

# TTest.py
# -*- coding: utf-8 -*-
'''
# Created on 2020-05-20 20:36
# TTest.py
# @author: huiwenhua
'''

## Import the packages
import numpy as np
from scipy import stats

def get_p_value(arrA, arrB):

  a = np.array(arrA)
  b = np.array(arrB)

  t, p = stats.ttest_ind(a,b)

  return p

if __name__ == "__main__":
  get_p_value([1, 2, 3, 5, ], [6, 7, 8, 9, 10])

2 🎜>
Der Zwei-Stichproben-t-Test dient dem Vergleich, ob es einen signifikanten Unterschied zwischen den beiden Populationsmittelwerten gibt, die durch die beiden Stichproben dargestellt werden. Zusätzlich zur Anforderung, dass die Stichproben aus einer Normalverteilung stammen, ist auch erforderlich, dass die Populationsvarianzen der beiden Stichproben gleich sind, was „Homogenität der Varianzen“ bedeutet.

Testen Sie die Nullhypothese: Es gibt keinen Unterschied in den Stichprobenmittelwerten (μ=μ0)

Python-Befehl stats.ttest_ind(data1,data2)

Wenn unsicher ist, ob Wenn die Varianzen der beiden Populationen gleich sind, sollten Sie zunächst den Levene-Test verwenden, um zu testen, ob die Varianzen der beiden Populationen homogen sind. stats.levene(data1,data2) Wenn der p-Wert des zurückgegebenen Ergebnisses viel größer als 0,05 ist, dann gehen wir davon aus, dass die beiden Populationen homogene Varianzen aufweisen. Wenn die beiden Populationen keine homogenen Varianzen aufweisen, müssen Sie den Parameter equal_val hinzufügen und ihn wie folgt auf False setzen.

stats.ttest_ind(data1,data2,equal_var=False) // Der Standardwert in TTest ist die Homogenität der Varianz

3. Ergebnisinterpretation
Wenn der p-Wert unter einem bestimmten Signifikanzniveau α (z. B. 0,05) liegt, wird davon ausgegangen, dass ein signifikanter Unterschied im Stichprobenmittelwert vorliegt. Die spezifische Analyse hängt davon ab, ob die bilaterale Hypothese vorliegt oder es wird die einseitige Hypothese gewählt (sie wird in „kleiner als“ und „größer als“ unterteilt). Beachten Sie, dass stats.ttest_ind einen zweiseitigen Test durchführt.


Wenn der t-Wert größer als 0 ist, besteht ((1-p) * 100) % Sicherheit, dass der erste Datensatz besser ist als der zweite Datensatz. Wenn beispielsweise p=0,05, dann sind wir zu 95 % sicher, dass der erste Datensatz besser ist als der zweite Datensatz.

Verwandte Lernempfehlungen:
Python-Video-Tutorial

Das obige ist der detaillierte Inhalt vonSo berechnen Sie den P-Wert zweier Datensätze basierend auf Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:jb51.net. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen