Rumah >pembangunan bahagian belakang >Tutorial Python >Teknik ujian khi kuasa dua dalam Python

Teknik ujian khi kuasa dua dalam Python

WBOY
WBOYasal
2023-06-10 09:24:003849semak imbas

Ujian Chi-square ialah kaedah statistik yang digunakan untuk menganalisis perubahan dalam saiz sampel dan darjah korelasi Ia biasanya digunakan dalam bidang analisis data dan pembelajaran mesin. Python ialah bahasa pengaturcaraan yang digunakan secara meluas dengan kecekapan dan fleksibiliti yang sangat baik dalam memproses data dan menggunakan ujian khi kuasa dua. Artikel ini akan memperkenalkan teknik ujian khi kuasa dua dalam Python untuk membantu pembaca memahami dan menggunakan kaedah statistik penting ini.

1. Konsep asas ujian khi kuasa dua

Ujian Khi kuasa dua digunakan untuk menguji kebebasan atau korelasi antara dua atau lebih pembolehubah. Ia menggunakan statistik khi kuasa dua untuk mengukur perbezaan antara nilai yang diperhatikan dan dijangka. Formula statistik khi kuasa dua adalah seperti berikut:

X^2 = Σ(Oi - Ei)^2 / Ei

di mana Oi ialah nilai cerapan, Ei ialah nilai jangkaan , dan Σ ialah simbol jumlah. Statistik khi kuasa dua dikira sebagai fungsi darjah kebebasan, iaitu tahap di mana data bebas untuk berubah-ubah, dan tahap keertian. Formulanya ialah:

df = (r - 1) x (c - 1)

Di mana, r ialah bilangan baris dan c ialah bilangan lajur. Tahap keertian merujuk kepada kebarangkalian salah dan biasanya ditetapkan kepada 0.05 atau 0.01.

2. Fungsi ujian Chi-square dalam Python

Dalam Python, anda boleh menggunakan fungsi stats.chi2_contingency dalam perpustakaan SciPy untuk melaksanakan ujian chi-square. Fungsi ini mengira keputusan ujian khi kuasa dua kebebasan antara dua atau lebih pembolehubah kategori, mengembalikan tuple yang mengandungi statistik khi kuasa dua, nilai p, darjah kebebasan dan nilai jangkaan.

Berikut ialah sintaks fungsi ini:

chi2, pval, dof, expctd = stats.chi2_contingency(observed)

di mana diperhatikan ialah matriks yang mengandungi nilai yang diperhatikan, Baris matriks mewakili satu pembolehubah dan lajur mewakili pembolehubah lain.

3 Menggunakan Python untuk melakukan ujian khi kuasa dua

Sekarang, mari lihat contoh praktikal. Katakan kami mempunyai set data yang mengandungi berbilang pembolehubah kategori dan kami ingin menentukan sama ada pembolehubah ini bebas antara satu sama lain. Dalam contoh ini, kami akan menggunakan set data tiruan yang mengandungi jantina dan keutamaan. Format data adalah seperti berikut:

data = [[45, 21, 16],
        [34, 32, 26]]

Antaranya, 45 orang adalah daripada kumpulan lelaki, 21 orang suka pisang, dan 16 orang adalah daripada kumpulan perempuan, 32 orang suka pisang , dan 26 orang menyukai epal.

Kita boleh menggunakan fungsi stats.chi2_contingency untuk mengira keputusan ujian khi kuasa dua:

from scipy import stats

data = [[45, 21, 16],
        [34, 32, 26]]

chi2, pval, dof, expctd = stats.chi2_contingency(data)

print('卡方统计量:', chi2)
print('p值:', pval)
print('自由度:', dof)
print('期望值:', expctd)

Hasil larian ialah:

卡方统计量: 6.1589105976316335
p值: 0.046274961203698944
自由度: 2
期望值: [[37.28571429 21.40559441 22.30869129]
         [41.71428571 31.59440559 32.69130871]]

Ia boleh dilihat bahawa pada aras keertian 0.05 Di bawah, kami menolak hipotesis nol bahawa terdapat kebebasan antara jantina dan keutamaan. Ini bermakna terdapat korelasi tertentu antara jantina dan keutamaan.

4. Ringkasan

Dalam Python, proses menggunakan ujian khi kuasa dua adalah sangat mudah. Kita boleh menggunakan fungsi stats.chi2_contingency dalam perpustakaan SciPy dan masukkan matriks yang mengandungi nilai yang diperhatikan untuk mendapatkan keputusan ujian khi kuasa dua. Apabila menggunakan ujian khi kuasa dua, penjagaan perlu diambil untuk memilih darjah kebebasan dan tahap keertian yang sesuai. Ujian khi kuasa dua ialah kaedah analisis data yang biasa dan berguna yang digunakan secara meluas dalam pembelajaran mesin dan statistik. Menguasai kemahiran ujian khi kuasa dua dalam Python sangat membantu untuk menyelidik dan menyelesaikan masalah praktikal.

Atas ialah kandungan terperinci Teknik ujian khi kuasa dua dalam Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn