統計學家使用 F 檢定來檢查兩個資料集是否具有相同的變異數。 F 檢驗以羅納德費雪爵士的名字命名。為了使用 F 檢驗,我們做兩個假設,一個原假設和一個備擇假設。然後我們選擇 F 檢定認可的這兩個假設中的任何一個。
變異數是一種資料分佈量測,用來說明資料與平均值的偏差。較高的值比較較小的值顯示出更大的離散度。
在本文中,您將學習如何在Python程式語言中執行F-Test以及其使用案例。
F-測試過程
執行F-檢定的過程如下:
首先,定義原假設和備擇假設。
零假設或H0:σ12 = σ22(總體變異數相等)
替代假設或 H1:σ12 ≠ σ22(總體變異數不相等)
#選擇用於測試的統計資料。
計算總體的自由度。例如,如果 m 和 n 是總體形狀,則自由度分別表示為 (df1) = m–1 和 (df2) = n – 1。
現在從 F 表中尋找 F 值。
最後,將雙尾檢定的 alpha 值除以 2,計算出臨界值。
因此,我們使用總體的自由度定義 F 值。我們讀取第一行中的 df1,而第一列中的 df2。
有各種用於獨特自由度的 F 表。我們將步驟 2 中的 F 統計量與步驟 4 中計算的臨界值進行比較。如果臨界值小於 F 統計量,我們可以拒絕原假設。相反,當臨界值在某個顯著水準上大於F統計量時,我們可以接受原假設。
假設
在進行基於資料集的F-檢定之前,我們做了一些假設。
資料整體服從常態分佈,即符合鐘形曲線。
樣本之間不相關,即人群中不存在多重共線性。
除了這些假設之外,在進行F檢定時,我們還應考慮以下關鍵要點:
最大變異值應該在分子中以執行右尾檢定。
在雙尾檢定中,將alpha除以2後確定臨界值。
檢查是否有變異數或標準差。
如果 F 表中沒有自由度,則以最大值作為臨界值。
F-Test在Python中的應用
文法
scipy stats.f()
參數
x : quantiles q : lower or upper tail probability dfn, dfd shape parameters loc :location parameter scale : scale parameter (default=1) size : random variate shape moments : [‘mvsk’] letters, specifying which moments to compute
Explanation
的中文翻譯為:解釋
在這個方法中,使用者必須將f_value和每個陣列的可迭代長度傳遞給scipy.stats.f.cdf(),並將其減去1以執行F檢定。
演算法
首先,導入NumPy和Scipy.stats函式庫進行操作。
然後建立兩個具有兩個不同變數名稱的隨機選擇值列表,並將它們轉換為 NumPy 數組,並使用 Numpy 計算每個數組的變異數。
定義一個函數來計算F分數,其中首先我們將數組的變異數除以自由度為1。
-
然後計算每個數組的可迭代長度,並將 f 值(方差比率)和長度傳遞到 CDF 函數中,並從 1 中減去該長度以計算 p 值。
最後,函數傳回 p_value 和 f_value。
範例
import numpy as np import scipy.stats # Create data group1 = [0.28, 0.2, 0.26, 0.28, 0.5] group2 = [0.2, 0.23, 0.26, 0.21, 0.23] # Converting the list to an array x = np.array(group1) y = np.array(group2) # Calculate the variance of each group print(np.var(group1), np.var(group2)) def f_test(group1, group2): f = np.var(group1, ddof=1)/np.var(group2, ddof=1) nun = x.size-1 dun = y.size-1 p_value = 1-scipy.stats.f.cdf(f, nun, dun) return f, p_value # perform F-test f_test(x, y)
輸出
Variances: 0.010464 0.00042400000000000017
您可以觀察到 F 檢定值為 4.38712, 對應的 p 值為 0.019127。
由於p值小於0.05,我們將放棄虛無假設。因此,我們可以說這兩個總體的變異數不相等。
結論
讀完本文後,您現在知道如何使用 F 檢定來檢查兩個樣本是否屬於具有相同變異數的總體。您已經了解了 F 測試過程、假設和 Python 實作。讓我們用一些要點來總結這篇文章 -
F檢定告訴你兩個總體是否有相等的變異數。
計算自由度並計算臨界值。
從F-表中找到F統計量,並將其與在前一步計算的關鍵值進行比較。
根據臨界值和 F 統計量比較接受或拒絕原假設。
以上是如何在Python中執行F檢驗的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本教程演示如何使用Python處理Zipf定律這一統計概念,並展示Python在處理該定律時讀取和排序大型文本文件的效率。 您可能想知道Zipf分佈這個術語是什麼意思。要理解這個術語,我們首先需要定義Zipf定律。別擔心,我會盡量簡化說明。 Zipf定律 Zipf定律簡單來說就是:在一個大型自然語言語料庫中,最頻繁出現的詞的出現頻率大約是第二頻繁詞的兩倍,是第三頻繁詞的三倍,是第四頻繁詞的四倍,以此類推。 讓我們來看一個例子。如果您查看美國英語的Brown語料庫,您會注意到最頻繁出現的詞是“th

本文解釋瞭如何使用美麗的湯庫來解析html。 它詳細介紹了常見方法,例如find(),find_all(),select()和get_text(),以用於數據提取,處理不同的HTML結構和錯誤以及替代方案(SEL)

處理嘈雜的圖像是一個常見的問題,尤其是手機或低分辨率攝像頭照片。 本教程使用OpenCV探索Python中的圖像過濾技術來解決此問題。 圖像過濾:功能強大的工具圖像過濾器

PDF 文件因其跨平台兼容性而廣受歡迎,內容和佈局在不同操作系統、閱讀設備和軟件上保持一致。然而,與 Python 處理純文本文件不同,PDF 文件是二進製文件,結構更複雜,包含字體、顏色和圖像等元素。 幸運的是,借助 Python 的外部模塊,處理 PDF 文件並非難事。本文將使用 PyPDF2 模塊演示如何打開 PDF 文件、打印頁面和提取文本。關於 PDF 文件的創建和編輯,請參考我的另一篇教程。 準備工作 核心在於使用外部模塊 PyPDF2。首先,使用 pip 安裝它: pip 是 P

本教程演示瞭如何利用Redis緩存以提高Python應用程序的性能,特別是在Django框架內。 我們將介紹REDIS安裝,Django配置和性能比較,以突出顯示BENE

本文比較了Tensorflow和Pytorch的深度學習。 它詳細介紹了所涉及的步驟:數據準備,模型構建,培訓,評估和部署。 框架之間的關鍵差異,特別是關於計算刻度的

本教程演示了在Python 3中創建自定義管道數據結構,利用類和操作員超載以增強功能。 管道的靈活性在於它能夠將一系列函數應用於數據集的能力,GE

Python是數據科學和處理的最愛,為高性能計算提供了豐富的生態系統。但是,Python中的並行編程提出了獨特的挑戰。本教程探討了這些挑戰,重點是全球解釋


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

Dreamweaver CS6
視覺化網頁開發工具

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

ZendStudio 13.5.1 Mac
強大的PHP整合開發環境