如何在Python中執行F檢驗-Python教學-PHP中文網

首頁

後端開發

Python教學

如何在Python中執行F檢驗

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Sep 09, 2023 pm 08:45 PM

python中的f檢驗執行f檢驗的python程式碼使用python進行f檢驗

統計學家使用 F 檢定來檢查兩個資料集是否具有相同的變異數。 F 檢驗以羅納德費雪爵士的名字命名。為了使用 F 檢驗，我們做兩個假設，一個原假設和一個備擇假設。然後我們選擇 F 檢定認可的這兩個假設中的任何一個。

變異數是一種資料分佈量測，用來說明資料與平均值的偏差。較高的值比較較小的值顯示出更大的離散度。

在本文中，您將學習如何在Python程式語言中執行F-Test以及其使用案例。

F-測試過程

執行F-檢定的過程如下：

首先，定義原假設和備擇假設。

零假設或H0：σ12 = σ22（總體變異數相等）
替代假設或 H1：σ12 ≠ σ22（總體變異數不相等）

#選擇用於測試的統計資料。
計算總體的自由度。例如，如果 m 和 n 是總體形狀，則自由度分別表示為 (df1) = m–1 和 (df2) = n – 1。
現在從 F 表中尋找 F 值。
最後，將雙尾檢定的 alpha 值除以 2，計算出臨界值。

因此，我們使用總體的自由度定義 F 值。我們讀取第一行中的 df1，而第一列中的 df2。

有各種用於獨特自由度的 F 表。我們將步驟 2 中的 F 統計量與步驟 4 中計算的臨界值進行比較。如果臨界值小於 F 統計量，我們可以拒絕原假設。相反，當臨界值在某個顯著水準上大於F統計量時，我們可以接受原假設。

如何在Python中執行F檢驗

假設

在進行基於資料集的F-檢定之前，我們做了一些假設。

資料整體服從常態分佈，即符合鐘形曲線。
樣本之間不相關，即人群中不存在多重共線性。

除了這些假設之外，在進行F檢定時，我們還應考慮以下關鍵要點：

最大變異值應該在分子中以執行右尾檢定。
在雙尾檢定中，將alpha除以2後確定臨界值。
檢查是否有變異數或標準差。
如果 F 表中沒有自由度，則以最大值作為臨界值。

F-Test在Python中的應用

文法

scipy stats.f()

參數

x :  quantiles
q :  lower or upper tail probability
dfn, dfd shape parameters
loc :location parameter
scale :  scale parameter (default=1)
size :  random variate shape
moments : [‘mvsk’] letters, specifying which moments to compute

Explanation

的中文翻譯為：

解釋

在這個方法中，使用者必須將f_value和每個陣列的可迭代長度傳遞給scipy.stats.f.cdf()，並將其減去1以執行F檢定。

演算法

首先，導入NumPy和Scipy.stats函式庫進行操作。
然後建立兩個具有兩個不同變數名稱的隨機選擇值列表，並將它們轉換為 NumPy 數組，並使用 Numpy 計算每個數組的變異數。
定義一個函數來計算F分數，其中首先我們將數組的變異數除以自由度為1。
然後計算每個數組的可迭代長度，並將 f 值（方差比率）和長度傳遞到 CDF 函數中，並從 1 中減去該長度以計算 p 值。
最後，函數傳回 p_value 和 f_value。

範例

import numpy as np
import scipy.stats

# Create data
group1 = [0.28, 0.2, 0.26, 0.28, 0.5]
group2 = [0.2, 0.23, 0.26, 0.21, 0.23]

# Converting the list to an array
x = np.array(group1)
y = np.array(group2)

# Calculate the variance of each group
print(np.var(group1), np.var(group2))

def f_test(group1, group2):
   f = np.var(group1, ddof=1)/np.var(group2, ddof=1)
   nun = x.size-1
   dun = y.size-1
   p_value = 1-scipy.stats.f.cdf(f, nun, dun)
   return f, p_value

# perform F-test
f_test(x, y)

輸出

Variances: 0.010464 0.00042400000000000017

您可以觀察到 F 檢定值為 4.38712， 對應的 p 值為 0.019127。

由於p值小於0.05，我們將放棄虛無假設。因此，我們可以說這兩個總體的變異數不相等。

結論

讀完本文後，您現在知道如何使用 F 檢定來檢查兩個樣本是否屬於具有相同變異數的總體。您已經了解了 F 測試過程、假設和 Python 實作。讓我們用一些要點來總結這篇文章 -

F檢定告訴你兩個總體是否有相等的變異數。
計算自由度並計算臨界值。
從F-表中找到F統計量，並將其與在前一步計算的關鍵值進行比較。
根據臨界值和 F 統計量比較接受或拒絕原假設。

以上是如何在Python中執行F檢驗的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：tutorialspoint。如有侵權，請聯絡admin@php.cn刪除

Numpy數組與使用數組模塊創建的數組有何不同？Apr 24, 2025 pm 03:53 PM

numpyArraysareAreBetterFornumericalialoperations andmulti-demensionaldata，而learthearrayModuleSutableforbasic，內存效率段

Numpy數組的使用與使用Python中的數組模塊陣列相比如何？Apr 24, 2025 pm 03:49 PM

numpyArraySareAreBetterForHeAvyNumericalComputing，而lelethearRayModulesiutable-usemoblemory-connerage-inderabledsswithSimpleDatateTypes.1）NumpyArsofferVerverVerverVerverVersAtility andPerformanceForlargedForlargedAtatasetSetsAtsAndAtasEndCompleXoper.2）

CTYPES模塊與Python中的數組有何關係？Apr 24, 2025 pm 03:45 PM

ctypesallowscreatingingangandmanipulatingc-stylarraysinpython.1）usectypestoInterfacewithClibrariesForperfermance.2）createc-stylec-stylec-stylarraysfornumericalcomputations.3）passarraystocfunctions foreforfunctionsforeffortions.however.however，However，HoweverofiousofmemoryManageManiverage，Pressiveo，Pressivero

在Python的上下文中定義'數組”和'列表”。Apr 24, 2025 pm 03:41 PM

Inpython，一個“列表” isaversatile，mutableSequencethatCanholdMixedDatateTypes，而“陣列” isamorememory-sepersequeSequeSequeSequeSequeRingequiringElements.1）列表

Python列表是可變還是不變的？那Python陣列呢？Apr 24, 2025 pm 03:37 PM

pythonlistsandArraysareBothable.1）列表Sareflexibleandsupportereceneousdatabutarelessmory-Memory-Empefficity.2）ArraysareMoremoremoremoreMemoremorememorememorememoremorememogeneSdatabutlesserversEversementime，defteringcorcttypecrecttypececeDepeceDyusagetoagetoavoavoiDerrors。