Rumah  >  Artikel  >  Peranti teknologi  >  Menganalisis masalah univariat, bivariat dan multikolineariti dalam pembelajaran mesin

Menganalisis masalah univariat, bivariat dan multikolineariti dalam pembelajaran mesin

王林
王林ke hadapan
2024-01-23 10:39:13758semak imbas

Menganalisis masalah univariat, bivariat dan multikolineariti dalam pembelajaran mesin

Univariate

Analisis data univariate ialah jenis analisis ringkas yang berfungsi dengan hanya satu pembolehubah yang berubah. Ia terutamanya memfokuskan pada perihalan dan pengecaman corak data, tetapi bukan pada sebab dan perhubungan. Oleh kerana maklumat berkaitan dengan pembolehubah tunggal, ia adalah jenis analisis yang paling mudah.

Analisis univariate digunakan untuk menganalisis pembolehubah/ciri tunggal. Matlamatnya adalah untuk mengambil data dan menerangkan serta meringkaskannya sambil meneliti sebarang corak yang mungkin wujud. Analisis univariat mengkaji setiap pembolehubah dalam set data secara berasingan dan boleh menggunakan kedua-dua pembolehubah kategori dan berangka.

Ukuran kecenderungan memusat (min, median dan mod) dan serakan atau pengedaran data (julat, minimum, maksimum, kuartil, varians dan sisihan piawai) boleh membantu kami menerangkan jenis mod data ini dalam . Selain itu, alatan seperti jadual taburan kekerapan, histogram, carta pai, poligon kekerapan dan carta bar boleh digunakan untuk menunjukkan corak ini.

Bivariate

Data bivariat melibatkan dua pembolehubah. Analisis bivariat memberi tumpuan kepada sebab dan hubungan, dengan matlamat untuk menentukan hubungan antara dua pembolehubah.

Perbandingan, korelasi, sebab dan penjelasan adalah sebahagian daripada analisis data bivariat. Salah satu pembolehubah adalah tidak bersandar manakala satu lagi adalah bersandar, dan pembolehubah ini selalunya diplot pada paksi X dan Y carta untuk pemahaman yang lebih baik tentang data.

Multikolineariti

Multikolineariti (juga dikenali sebagai kolineariti) ialah fenomena statistik di mana satu pembolehubah ciri dalam model regresi mempunyai korelasi linear yang tinggi dengan pembolehubah ciri yang lain. Apabila dua atau lebih pembolehubah berkorelasi sempurna, ini dipanggil kolineariti.

Apabila pembolehubah bebas sangat berkorelasi, perubahan dalam satu pembolehubah akan menyebabkan perubahan dalam pembolehubah lain, menyebabkan keputusan model berubah-ubah dengan banyaknya. Jika data atau model berubah sedikit, keputusan model akan menjadi tidak stabil dan turun naik secara meluas. Multikolineariti boleh membawa kepada masalah berikut:

Jika model memberikan hasil yang berbeza setiap kali, ia menjadi sukar untuk menentukan senarai pembolehubah penting untuk model.

Anggaran pekali akan menjadi tidak stabil, menjadikannya sukar untuk mentafsir model. Dalam erti kata lain, jika peramal berubah sebanyak satu unit, tidak ada cara untuk menentukan berapa banyak output akan berubah.

Disebabkan ketidakstabilan model, overfitting mungkin berlaku. Apabila model digunakan pada set data lain, ketepatan akan jauh lebih rendah daripada set data latihan.

Jika hanya kolineariti yang sedikit atau sederhana berlaku, ini mungkin tidak menjadi masalah untuk model, bergantung pada keadaan. Walau bagaimanapun, jika terdapat isu kolineariti yang teruk, adalah disyorkan untuk menyelesaikan isu tersebut.

Atas ialah kandungan terperinci Menganalisis masalah univariat, bivariat dan multikolineariti dalam pembelajaran mesin. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:163.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam