Rumah > Artikel > Peranti teknologi > Kaedah dan prasyarat untuk melaksanakan regresi linear menggunakan persamaan normal
Persamaan biasa ialah kaedah yang mudah dan intuitif untuk regresi linear. Garis lurus yang paling sesuai dikira terus melalui formula matematik tanpa menggunakan algoritma lelaran. Kaedah ini amat sesuai untuk set data kecil.
Pertama, mari kita semak semula prinsip asas regresi linear. Regresi linear ialah kaedah yang digunakan untuk meramalkan hubungan antara pembolehubah bersandar Y dan satu atau lebih pembolehubah tidak bersandar X. Terdapat hanya satu pembolehubah bebas X dalam regresi linear mudah, manakala dua atau lebih pembolehubah tidak bersandar dimasukkan dalam regresi linear berganda.
Dalam regresi linear, kami menggunakan kaedah kuasa dua terkecil untuk memuatkan garis lurus untuk meminimumkan jumlah jarak dari titik data ke garis lurus. Persamaan garis lurus ialah:
Y=β0+β1X1+β2X2+…+βnXn
Matlamat persamaan adalah untuk mencari pekali pintasan dan regresi yang optimum supaya ia paling sesuai dengan data.
Sekarang, mari lihat cara menggunakan persamaan normal untuk mengira β0 hingga βn yang optimum. Idea asas persamaan normal ialah kita boleh mendapatkan pekali regresi optimum dengan menyelesaikan sistem persamaan linear.
Bentuk sistem persamaan linear ini adalah seperti berikut:
(XT , β ialah vektor pekali regresi. Dalam sistem persamaan ini, kita perlu menyelesaikan β.
Seterusnya, kita perlu menukar sistem persamaan ini kepada bentuk yang boleh diselesaikan. Kita boleh mencapai langkah ini dengan mendarab kedua-dua belah sistem persamaan dengan matriks songsang (XT). Dengan cara ini, sistem persamaan menjadi normal Idea teras persamaan adalah untuk mendapatkan pekali regresi yang optimum dengan menyelesaikan sistem persamaan linear. Bentuk sistem persamaan ini ialah (XT X)β=XT Y, di mana X ialah matriks pembolehubah bebas, Y ialah vektor pembolehubah bersandar, XT ialah transpose bagi Kita boleh menyelesaikan β dengan mendarab kedua-dua belah sistem persamaan dengan matriks songsang bagi (XT). Kaedah ini sangat mudah dan mudah difahami, dan berfungsi dengan baik untuk set data kecil. Walau bagaimanapun, perlu diingatkan bahawa kerumitan pengiraan persamaan normal ialah O(n^3), jadi kaedah ini mungkin tidak sesuai apabila berurusan dengan set data yang besar.
Kelebihan persamaan normal ialah ia boleh mengira secara langsung pekali regresi optimum tanpa menggunakan algoritma lelaran. Di samping itu, penyelesaian kaedah ini adalah unik, jadi tidak ada masalah penyelesaian optimum tempatan berbilang.
Walau bagaimanapun, persamaan normal juga mempunyai beberapa kelemahan. Pertama, ia memerlukan pengiraan matriks songsang bagi (XT Jika matriks (XT Tambahan pula, persamaan normal dengan kerumitan pengiraan O(n^3) boleh menjadi sangat perlahan apabila berurusan dengan set data yang besar, jadi algoritma lelaran mungkin lebih sesuai untuk kes ini.
Apabila menggunakan persamaan normal untuk regresi linear, syarat berikut perlu dipenuhi:
1 Hubungan linear
Persamaan normal hanya terpakai kepada data dengan hubungan linear. pembolehubah bersandar dan pembolehubah tidak bersandar Hubungan mestilah linear. Jika data tidak memenuhi hubungan linear, maka persamaan normal tidak boleh mendapatkan model pemasangan yang baik.
2. Tiada multikolineariti
Multikolineariti merujuk kepada keadaan di mana terdapat tahap korelasi yang tinggi antara pembolehubah bebas. Jika multikolineariti wujud, persamaan normal mungkin tidak menghasilkan model pemasangan yang tepat. Dalam aplikasi praktikal, multikolineariti boleh disemak dengan mengira pekali korelasi antara pembolehubah bebas.
3. Kebebasan data
Persamaan normal memerlukan data itu bebas, iaitu tiada korelasi antara data antara setiap sampel. Jika data tidak bebas, maka persamaan normal mungkin menghasilkan kesesuaian model berat sebelah.
4. Kehomogenan varians
Kehomogenan varians bermakna varians bagi pembolehubah bersandar harus kekal sama di bawah nilai yang berbeza bagi pembolehubah bebas. Jika varians tidak homogen, maka persamaan normal boleh menghasilkan model yang tidak tepat dipasang. Dalam aplikasi praktikal, kehomogenan varians boleh disemak dengan memplot baki.
5. Ralat mematuhi taburan normal
Persamaan normal memerlukan ralat mematuhi taburan normal, iaitu baki hendaklah rawak dan menepati ciri taburan normal. Jika ralat tidak diedarkan secara normal, maka persamaan normal mungkin menghasilkan model yang tidak dipasang dengan tepat.
Perlu diingatkan bahawa keadaan di atas tidak bebas antara satu sama lain, dan ia boleh menjejaskan satu sama lain. Dalam aplikasi praktikal, kita perlu mempertimbangkan secara menyeluruh syarat-syarat ini dan memilih model regresi yang sesuai berdasarkan ciri-ciri data. Jika data tidak memenuhi syarat persamaan normal, anda boleh mempertimbangkan untuk menggunakan kaedah regresi lain, seperti regresi rabung, regresi laso, dsb.
Ringkasnya, persamaan normal ialah kaedah regresi linear yang mudah dan mudah difahami sesuai untuk set data kecil. Tetapi apabila berurusan dengan set data yang besar, anda perlu memberi perhatian kepada isu kerumitan pengiraan dan pertimbangkan untuk menggunakan kaedah lain.
Atas ialah kandungan terperinci Kaedah dan prasyarat untuk melaksanakan regresi linear menggunakan persamaan normal. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!