Rumah >Peranti teknologi >AI >Takrifan dan fungsi pereputan berat, dan apakah kaedah pereputan berat untuk menyekat overfitting?

Takrifan dan fungsi pereputan berat, dan apakah kaedah pereputan berat untuk menyekat overfitting?

PHPzke hadapan: 2024-01-22 18:57:05949semak imbas

Reput berat ialah teknik regularisasi yang biasa digunakan yang mencapai regularisasi dengan menghukum parameter berat model. Dalam pembelajaran mendalam, masalah terlalu sesuai selalunya disebabkan oleh model yang terlalu kompleks dan mempunyai terlalu banyak parameter. Fungsi pengecilan berat adalah untuk mengurangkan kerumitan model dan mengurangkan risiko overfitting dengan menghukum berat model. Penalti ini dicapai dengan menambah istilah regularisasi pada fungsi kehilangan yang berkadar dengan jumlah kuasa dua parameter berat. Semasa proses latihan, pereputan berat akan menjadikan model lebih cenderung untuk memilih nilai berat yang lebih kecil, sekali gus mengurangkan kerumitan model. Dengan melaraskan pekali pengecilan berat dengan sewajarnya, keupayaan pemasangan dan generalisasi model boleh diseimbangkan

Pengecilan berat badan ialah kaedah yang berkesan menyekat masalah overfitting pada rangkaian saraf dalam. Ia mencapai penyelarasan dengan menghukum parameter berat model. Khususnya, pereputan berat menambah tempoh penalti pada fungsi kehilangan yang berkadar dengan kuasa dua parameter berat. Melakukannya boleh menggalakkan parameter berat model menghampiri 0, sekali gus mengurangkan kerumitan model. Melalui pengecilan berat badan, kita boleh mengimbangi prestasi model pada set latihan dan set ujian, meningkatkan keupayaan generalisasi model, dan mengelakkan masalah overfitting pada set latihan.

Sebagai contoh, andaikan parameter berat model ialah W dan fungsi kehilangan ialah L, maka fungsi kehilangan pengecilan berat boleh ditulis sebagai:

L'=L+λ*||W ||^2

Di mana, ||W||^2 mewakili jumlah kuasa dua W, dan λ ialah hiperparameter yang digunakan untuk mengawal saiz penalti. Semakin besar λ, semakin kuat kesan hukuman dan semakin hampir parameter berat W kepada 0.

Reputan berat badan biasanya dilaksanakan dalam dua cara: regularization L2 dan regularization L1. Regularisasi L2 ialah kaedah regularisasi yang menambah jumlah kuasa dua parameter berat kepada fungsi kehilangan, manakala regularisasi L1 ialah kaedah regularisasi yang menambah nilai mutlak parameter berat kepada fungsi kehilangan. Perbezaan antara kedua-dua kaedah adalah bahawa penyelarasan L2 akan menjadikan parameter berat cenderung diedarkan dalam taburan Gaussian hampir kepada 0, manakala penyelarasan L1 akan menjadikan parameter berat cenderung diedarkan dalam taburan yang jarang 0.

Prinsip bahawa pereputan berat boleh menyekat overfitting boleh dijelaskan dari banyak aspek. Pertama, pereputan berat boleh mengurangkan kerumitan model dan mengurangkan kapasiti model. Pemasangan berlebihan biasanya disebabkan oleh model yang terlalu kompleks, dan pereputan berat boleh mengelakkan masalah ini dengan mengurangkan kerumitan model.

Kedua, pereputan berat boleh mengawal parameter berat model supaya tidak terlalu berat sebelah terhadap ciri-ciri tertentu. Apabila parameter berat model terlalu besar, model itu mungkin menganggap data hingar sebagai ciri yang sah, yang membawa kepada pemasangan berlebihan. Dengan menghukum parameter berat yang besar, pereputan berat boleh menjadikan model memberi lebih perhatian kepada ciri penting dan mengurangkan sensitiviti kepada data yang bising.

Selain itu, pereputan berat badan juga boleh mengurangkan saling bergantung antara ciri, yang juga boleh menyebabkan overfitting dalam beberapa kes. Dalam sesetengah set data, mungkin terdapat kolineariti antara ciri yang berbeza, yang bermaksud terdapat tahap korelasi yang tinggi di antara mereka. Pada masa ini, jika model memberi terlalu banyak perhatian kepada beberapa ciri, ia boleh menyebabkan pemasangan berlebihan. Dengan menghukum parameter berat yang serupa, pereputan berat boleh mengurangkan pergantungan antara ciri, seterusnya mengurangkan risiko pemasangan berlebihan.

Akhir sekali, pereputan berat badan juga dapat mengelakkan masalah letupan kecerunan. Dalam rangkaian saraf dalam, disebabkan oleh struktur rangkaian yang kompleks dan fungsi pengaktifan tak linear, masalah letupan kecerunan terdedah untuk berlaku, yang menjadikan latihan model sangat sukar. Dengan menghukum parameter berat yang besar, pereputan berat boleh melambatkan kelajuan kemas kini parameter berat dan mengelakkan masalah letupan kecerunan.

Secara lebih khusus, sebab mengapa pengecilan berat boleh menghalang pemasukan berlebihan adalah seperti berikut:

Mengurangkan kerumitan model: Pemasangan berlebihan biasanya kerana model terlalu kompleks, dan pengecilan berat mengurangkan kerumitan model dengan mengurangkan kerumitan model untuk menyelesaikan masalah ini. Tempoh penalti akan memaksa parameter berat menjadi lebih hampir kepada 0, yang boleh mengurangkan ciri berlebihan dan dengan itu mengurangkan kerumitan model.

Cegah kolineariti ciri: Dalam sesetengah kes, terdapat kolineariti antara ciri, yang boleh membawa kepada pemasangan model yang berlebihan. Pereputan berat boleh mengurangkan kolineariti antara ciri dengan menghukum parameter berat yang serupa, dengan itu mengurangkan risiko overfitting.

Tingkatkan keupayaan generalisasi: Model terlampau dipasang biasanya berprestasi baik pada data latihan tetapi berprestasi lemah pada data ujian. Pereputan berat boleh meningkatkan keupayaan generalisasi model dengan mengurangkan kerumitan model dan kolineariti antara ciri, menjadikannya berprestasi lebih baik pada data ujian.

Kawal kelajuan pembelajaran model: Pereputan berat boleh mengawal kelajuan pembelajaran model, sekali gus menghalang model daripada dipasang secara berlebihan. Dalam pereputan berat, saiz tempoh penalti adalah berkadar dengan kuasa dua parameter berat, jadi parameter berat yang besar akan dikenakan lebih banyak, manakala parameter berat yang kecil akan dikenakan penalti kurang. Ini menghalang parameter berat model daripada terlalu berat sebelah terhadap ciri-ciri tertentu, sekali gus menghalang model daripada dipasang secara berlebihan.

Elakkan letupan kecerunan: Dalam rangkaian neural dalam, disebabkan oleh struktur rangkaian yang kompleks dan sifat tak linear fungsi pengaktifan, masalah letupan kecerunan terdedah untuk berlaku. Pereputan berat boleh melambatkan kelajuan kemas kini parameter berat, dengan itu mengelakkan masalah letupan kecerunan.

Ringkasnya, pereputan berat badan adalah teknik regularization yang sangat berkesan yang boleh menyekat masalah over-fitting model melalui banyak aspek. Dalam aplikasi praktikal, pereputan berat sering digunakan bersama-sama dengan teknik regularisasi lain seperti keciciran untuk meningkatkan lagi prestasi dan keupayaan generalisasi model.

Atas ialah kandungan terperinci Takrifan dan fungsi pereputan berat, dan apakah kaedah pereputan berat untuk menyekat overfitting?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan：

Artikel ini dikembalikan pada:163.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam

Artikel sebelumnya：Memperkenalkan norma vektor dalam pembelajaran mesin: norma L1, L2 dan L∞Artikel seterusnya：Memperkenalkan norma vektor dalam pembelajaran mesin: norma L1, L2 dan L∞

Artikel berkaitan

Lihat lagi