Rumah >Peranti teknologi >AI >Aplikasi pengelompokan hierarki dalam pembelajaran mesin

Aplikasi pengelompokan hierarki dalam pembelajaran mesin

王林
王林ke hadapan
2024-01-23 11:48:121116semak imbas

Aplikasi pengelompokan hierarki dalam pembelajaran mesin

Kluster hierarki ialah kaedah pembelajaran tanpa pengawasan yang digunakan untuk mengumpulkan objek dalam set data mengikut persamaan. Kaedah ini berfungsi dengan membahagikan set data secara berperingkat kepada subset yang lebih kecil dan lebih kecil, akhirnya membentuk struktur hierarki di mana setiap subset boleh dilihat sebagai gugusan. Pengelompokan hierarki termasuk dua jenis: aglomeratif dan pembahagian. Pengelompokan hierarki aglomeratif bermula dengan setiap objek sebagai gugusan awal dan kemudian secara beransur-ansur menggabungkan gugusan serupa sehingga semua objek digabungkan menjadi satu gugusan. Pengelompokan hierarki schizoidal bermula dengan keseluruhan set data sebagai gugusan awal dan kemudian secara beransur-ansur membahagikan gugusan kepada gugusan yang lebih kecil sehingga setiap objek membentuk gugusan yang berasingan. Kaedah pengelompokan hierarki mampu memberikan fleksibiliti berkenaan bilangan gugusan sambil juga mampu menangkap , dengan menggabungkan secara beransur-ansur gugusan dengan persamaan yang tinggi untuk membentuk gugusan besar atau mencapai bilangan gugusan yang diperlukan. Kaedah ini mempunyai kelebihan untuk menyesuaikan diri dengan gugusan bentuk arbitrari dan tidak memerlukan bilangan gugusan untuk dinyatakan terlebih dahulu. Walau bagaimanapun, ia sangat sensitif kepada bunyi bising dan outlier dan mengalami kerumitan pengiraan yang tinggi. Oleh itu, apabila menggunakan pengelompokan hierarki aglomeratif, data perlu dipraproses untuk menghilangkan hingar dan outlier, manakala perhatian harus diberikan kepada penggunaan sumber pengkomputeran.

Pengelompokan hierarki Schizoid ialah kaedah atas ke bawah yang mencapai pengelompokan dengan membahagikan keseluruhan set data secara beransur-ansur kepada subset yang lebih kecil dan lebih kecil. Ia mempunyai kelebihan kerana tidak sensitif terhadap bunyi dan outlier dan mempunyai kerumitan pengiraan yang rendah. Walau bagaimanapun, kelemahan pengelompokan hierarki schizotypal ialah ia tidak boleh menyesuaikan diri dengan gugusan bentuk sewenang-wenangnya dan memerlukan bilangan gugusan untuk dinyatakan terlebih dahulu.

Inti pengelompokan hierarki ialah pengukuran kesamaan kaedah pengukuran biasa termasuk jarak Euclidean, jarak Manhattan dan persamaan kosinus. Langkah-langkah ini digunakan dalam proses pengelompokan untuk mengira jarak atau persamaan antara kelompok untuk menentukan penggabungan atau pembahagian kelompok. Pengelompokan hierarki membina hierarki pengelompokan dengan menggabungkan atau membahagikan gugusan secara berterusan, dengan setiap peringkat mewakili bilangan gugusan yang berbeza.

Langkah utama algoritma pengelompokan hierarki termasuk:

1. Kira jarak atau matriks persamaan antara sampel.

2. Rawat setiap sampel sebagai kelompok dan bina pokok kelompok awal.

3. Ulangi langkah berikut sehingga gugusan terbentuk:

a.

b Cantumkan dua gugusan dengan jarak atau persamaan terkecil.
  • c.
  • d. Tentukan bilangan atau ambang kluster dan bahagikan kluster mengikut keperluan.
  • Dalam aplikasi praktikal, pengelompokan hierarki sering digunakan dalam pembahagian imej, pengelompokan teks, bioinformatik, analisis rangkaian sosial dan bidang lain. Sebagai contoh, pengelompokan hierarki boleh digunakan untuk mengelompokkan satu set dokumen teks ke dalam kumpulan yang berkaitan secara tematik, atau untuk membahagikan satu set imej ke dalam kawasan yang berkaitan. Dalam bioinformatik, pengelompokan hierarki boleh digunakan untuk menganalisis data ekspresi gen untuk menentukan gen yang berkaitan antara satu sama lain, dengan itu mengenal pasti set gen yang berkaitan dengan penyakit tertentu.

Ringkasnya, pengelompokan hierarki ialah kaedah pembelajaran mesin biasa tanpa pengawasan yang boleh membahagikan set data kepada kelompok berbeza berdasarkan persamaan dan membentuk hierarki pengelompokan. Pengelompokan hierarki aglomeratif dan pengelompokan hierarki pembahagian ialah dua kaedah pengelompokan hierarki yang biasa. Dalam aplikasi, pengelompokan hierarki boleh digunakan dalam pembahagian imej, pengelompokan teks, bioinformatik, analisis rangkaian sosial dan bidang lain.

Atas ialah kandungan terperinci Aplikasi pengelompokan hierarki dalam pembelajaran mesin. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:163.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam