Rumah > Artikel > Peranti teknologi > Meneroka struktur dan corak terpendam dalam data: Aplikasi pembelajaran tanpa pengawasan
Pembelajaran tanpa pengawasan ialah kaedah pembelajaran mesin yang mencari struktur dan corak tersembunyi dengan menganalisis data tidak berlabel. Tidak seperti pembelajaran diselia, pembelajaran tanpa penyeliaan tidak bergantung pada label output yang telah ditetapkan. Oleh itu, ia boleh digunakan untuk tugas seperti menemui struktur tersembunyi dalam data, pengurangan dimensi, pengekstrakan ciri dan pengelompokan. Pembelajaran tanpa pengawasan menyediakan alat yang berkuasa untuk analisis data yang boleh membantu kami memahami data dan menemui peraturan serta corak di dalamnya.
Pembelajaran tanpa seliaan merangkumi pelbagai kaedah Prinsip dan algoritma diperkenalkan di bawah:
1
Pengkelompokan adalah salah satu kaedah pembelajaran yang biasa digunakan dalam tanpa pengawasan objek dibahagikan kepada beberapa kumpulan, supaya persamaan objek dalam kumpulan adalah tinggi dan persamaan antara kumpulan adalah rendah. Algoritma biasa termasuk K-Means, pengelompokan hierarki, DBSCAN, dsb.
Prinsip algoritma K-Means adalah untuk membahagikan set data kepada kelompok K, dan setiap kelompok diwakili oleh centroid. Langkah-langkah algoritma termasuk memulakan centroid, mengira jarak antara setiap titik data dan centroid, mengklasifikasikan titik data ke dalam kelompok terdekat, mengira semula centroid gugusan, dan mengulangi langkah sebelumnya sehingga penumpuan. Kelebihan algoritma K-Means ialah ia pantas dalam pengiraan, tetapi keputusannya mungkin dipengaruhi oleh centroid awal. Idea teras algoritma ini adalah untuk meminimumkan jarak antara titik data dalam kelompok dan centroid supaya persamaan titik data dalam kelompok adalah yang paling tinggi dan persamaan titik data antara kelompok adalah yang paling rendah. Pembahagian tersebut boleh digunakan dalam bidang aplikasi seperti pengelompokan data dan pembahagian imej. Walau bagaimanapun, algoritma K-Means adalah sensitif kepada outlier dan hingar, dan bilangan gugusan K perlu ditentukan terlebih dahulu. Untuk mengatasi masalah ini, algoritma K-Means yang dipertingkatkan boleh digunakan, seperti K-Means++, Mini-Batch K
2, pengurangan dimensi
Pengurangan dimensi merupakan satu lagi tugas penting dalam pembelajaran tanpa pengawasan, dan tujuan Ia menukar data berdimensi tinggi kepada data berdimensi rendah untuk memudahkan visualisasi, pengiraan dan tugasan lain. Algoritma pengurangan dimensi biasa termasuk analisis komponen utama (PCA), t-SNE, LLE, dsb.
Prinsip algoritma PCA adalah untuk mengubah pembolehubah dalam set data kepada satu set pembolehubah tidak berkorelasi baharu melalui transformasi linear ini dipanggil komponen utama. Langkah-langkah PCA termasuk mengira matriks kovarians set data, mengira vektor eigen dan nilai eigen matriks kovarians, memilih vektor eigen sepadan dengan nilai eigen terbesar K teratas, dan mengunjurkan set data melalui vektor eigen K ini. Kelebihan algoritma PCA ialah ia boleh mengurangkan maklumat berlebihan dalam set data, tetapi keputusannya mungkin dipengaruhi oleh hingar dalam set data.
3. Pengesanan anomali
Pengesanan anomali ialah tugas dalam pembelajaran tanpa pengawasan, yang tujuannya adalah untuk mengesan titik abnormal atau outlier dalam set data. Algoritma pengesanan anomali biasa termasuk kaedah berasaskan model statistik, kaedah berasaskan kluster, kaedah berasaskan kepadatan, dsb.
Prinsip kaedah pengesanan anomali berdasarkan model statistik adalah untuk menganggap bahawa data normal dalam set data mematuhi taburan kebarangkalian tertentu, dan kemudian menggunakan kaedah inferens statistik untuk mengesan titik data dalam set data yang tidak mematuhi kepada taburan kebarangkalian ini. Model statistik yang biasa digunakan termasuk taburan Gaussian, model Markov, dsb.
Ringkasnya, pembelajaran tanpa pengawasan boleh mencapai tugas seperti penerokaan data, pengurangan dimensi, pengekstrakan ciri, pengelompokan dan pengesanan anomali dengan menemui struktur dan corak yang berpotensi dalam data. Dalam aplikasi praktikal, kaedah pembelajaran tanpa pengawasan yang berbeza boleh digunakan secara gabungan untuk mencapai hasil yang lebih baik.
Atas ialah kandungan terperinci Meneroka struktur dan corak terpendam dalam data: Aplikasi pembelajaran tanpa pengawasan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!