Pengelompokan tanpa pengawasan menggunakan algoritma K-means-AI-php.cn

Rumah

Peranti teknologi

Pengelompokan tanpa pengawasan menggunakan algoritma K-means

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jan 23, 2024 am 08:06 AM

pembelajaran mesin

Pengelompokan tanpa pengawasan menggunakan algoritma K-means

K-means clustering ialah algoritma pengelompokan tanpa pengawasan yang biasa digunakan yang mencapai persamaan intra-kluster yang tinggi dan kesamaan antara kelompok dengan membahagikan set data kepada k kelompok, setiap kelompok mengandungi titik data yang serupa. Artikel ini akan memperkenalkan cara menggunakan K-means untuk pengelompokan tanpa pengawasan.

1. Prinsip asas pengelompokan K-means

K-means clustering ialah algoritma pembelajaran tanpa penyeliaan yang biasa digunakan ialah membahagikan titik data kepada kluster supaya setiap titik data adalah Milik satu daripada kluster, dan persamaan titik data dalam kluster adalah setinggi mungkin, dan persamaan antara kluster berbeza adalah serendah mungkin. Langkah-langkah khusus adalah seperti berikut:

1. Permulaan: pilih k titik data secara rawak sebagai pusat kluster.

2. Tugasan: Tetapkan setiap titik data kepada kluster di mana pusat klusternya terletak.

3. Kemas kini: Kira semula pusat kluster setiap kluster.

4 Ulangi langkah 2 dan 3 sehingga gugusan tidak lagi berubah atau bilangan lelaran yang telah ditetapkan tercapai.

Matlamat pengelompokan K-means adalah untuk meminimumkan jumlah jarak antara titik data dalam setiap gugusan dan pusat gugusan gugusan ini juga dipanggil "jumlah ralat kuadrat intra-kluster (SSE )". Algoritma berhenti lelaran apabila nilai SSE tidak lagi berkurangan atau mencapai bilangan lelaran yang telah ditetapkan.

2. Langkah pelaksanaan pengelompokan K-means

Langkah pelaksanaan algoritma pengelompokan K-means adalah seperti berikut:

1 Pilih pusat k sebagai pusat kluster.

2. Kira jarak: Kira jarak antara setiap titik data dan pusat kluster, dan pilih kluster dengan pusat kluster terdekat.

3. Kemas kini pusat kluster: Kira semula pusat kluster untuk setiap kluster, iaitu purata koordinat semua titik data dalam kluster digunakan sebagai pusat kluster baharu.

4 Ulangi langkah 2 dan 3 sehingga bilangan lelaran yang telah ditetapkan tercapai atau gugusan tidak lagi berubah.

5. Keluaran hasil pengelompokan: Tetapkan setiap titik data dalam set data kepada kelompok akhir dan keluarkan hasil pengelompokan.

Apabila melaksanakan algoritma pengelompokan K-means, anda perlu memberi perhatian kepada perkara berikut:

1 Permulaan pusat kluster: Pemilihan pusat kluster mempunyai kesan yang besar terhadap kesan pengelompokan. Secara umumnya, k titik data boleh dipilih secara rawak sebagai pusat kluster.

2 Pemilihan kaedah pengiraan jarak: Kaedah pengiraan jarak yang biasa digunakan termasuk jarak Euclidean, jarak Manhattan dan persamaan kosinus, dsb. Kaedah pengiraan jarak yang berbeza sesuai untuk jenis data yang berbeza.

3 Pemilihan bilangan kluster k: Pemilihan bilangan kluster k selalunya merupakan isu subjektif dan perlu dipilih mengikut senario aplikasi tertentu. Secara umumnya, bilangan gugusan yang optimum boleh ditentukan melalui kaedah seperti kaedah siku dan pekali siluet.

3. Kebaikan dan keburukan K-means clustering

Kelebihan K-means clustering termasuklah:

2. Boleh mengendalikan set data berskala besar.

3. Apabila pengedaran data agak seragam, kesan pengelompokan adalah lebih baik.

Kelemahan K-means clustering termasuk:

1 Ia agak sensitif kepada permulaan pusat kluster dan mungkin menumpu kepada penyelesaian optimum tempatan.

2. Pemprosesan titik abnormal tidak cukup berkesan.

3. Apabila pengedaran data tidak sekata atau bunyi bising, kesan pengelompokan mungkin lemah.

4. Kaedah pengelompokan K-means yang lebih baik

Untuk mengatasi batasan pengelompokan K-means, para penyelidik telah mencadangkan banyak kaedah yang ditambah baik, termasuk:

pusat pengelompokan dari titik data ke titik perwakilan (medoid) dalam gugusan boleh mengendalikan outlier dan hingar dengan lebih baik.

2. Algoritma pengelompokan berasaskan ketumpatan: seperti DBSCAN, OPTIK, dsb., boleh mengendalikan gugusan ketumpatan yang berbeza dengan lebih baik.

3 Pengelompokan spektrum: Anggap titik data sebagai nod dalam graf, anggap persamaan sebagai pemberat tepi, dan laksanakan pengelompokan melalui penguraian spektrum graf, yang boleh mengendalikan gugusan bukan cembung dan gugusan bentuk yang berbeza.

4. Pengelompokan hierarki: Anggap titik data sebagai nod dalam pepohon, dan laksanakan pengelompokan dengan menggabungkan atau membelah gugusan secara berterusan untuk mendapatkan struktur hierarki gugusan.

5 Kluster kabur: Peruntukkan titik data kepada kluster yang berbeza Setiap titik data mempunyai tahap keahlian untuk setiap kluster, yang boleh mengendalikan situasi di mana ketidakpastian titik data adalah besar.

🎜🎜Ringkasnya, pengelompokan K-means ialah algoritma pengelompokan tanpa pengawasan yang mudah dan berkesan, tetapi batasannya perlu diberi perhatian dalam aplikasi praktikal, dan kaedah penambahbaikan lain boleh digabungkan untuk meningkatkan kesan pengelompokan. 🎜

Atas ialah kandungan terperinci Pengelompokan tanpa pengawasan menggunakan algoritma K-means. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan

Artikel ini dikembalikan pada:网易伏羲. Jika ada pelanggaran, sila hubungi admin@php.cn Padam

Artikel Berkaitan

Satu arahan boleh memintas setiap perlindungan utama LLMApr 25, 2025 am 11:16 AM

Penyelidikan terobosan HiddenLayer mendedahkan kelemahan kritikal dalam model bahasa yang besar (LLMS). Penemuan mereka mendedahkan teknik bypass sejagat, yang digelar "Bonfetri Policy," mampu mengelakkan hampir semua LLM utama

5 Kesalahan Kebanyakan perniagaan akan membuat tahun ini dengan kemampananApr 25, 2025 am 11:15 AM

Dorongan untuk tanggungjawab alam sekitar dan pengurangan sisa secara asasnya mengubah bagaimana perniagaan beroperasi. Transformasi ini mempengaruhi pembangunan produk, proses pembuatan, hubungan pelanggan, pemilihan rakan kongsi, dan penggunaan baru

H20 Chip Ban Jolts China AI Firma, tetapi mereka telah lama bersiap untuk kesanApr 25, 2025 am 11:12 AM

Sekatan baru -baru ini mengenai perkakasan AI maju menyerlahkan persaingan geopolitik yang semakin meningkat untuk dominasi AI, mendedahkan pergantungan China terhadap teknologi semikonduktor asing. Pada tahun 2024, China mengimport semikonduktor bernilai $ 385 bilion

Jika Openai membeli Chrome, AI boleh memerintah perang penyemak imbasApr 25, 2025 am 11:11 AM

Potensi yang dipaksa oleh Chrome dari Google telah menyalakan perdebatan sengit dalam industri teknologi. Prospek Openai memperoleh pelayar terkemuka, yang membanggakan bahagian pasaran global 65%, menimbulkan persoalan penting mengenai masa depan th

Bagaimana AI dapat menyelesaikan kesakitan media runcitApr 25, 2025 am 11:10 AM

Pertumbuhan media runcit semakin perlahan, walaupun melampaui pertumbuhan pengiklanan secara keseluruhan. Fasa kematangan ini memberikan cabaran, termasuk pemecahan ekosistem, peningkatan kos, isu pengukuran, dan kerumitan integrasi. Walau bagaimanapun, Buatan Buatan

'Ai adalah kita, dan lebih daripada kita'Apr 25, 2025 am 11:09 AM

Satu retak radio lama dengan statik di tengah -tengah koleksi skrin berkedip dan lengai. Tumpukan elektronik yang tidak menentu ini, dengan mudah tidak stabil, membentuk teras "Tanah E-Waste," salah satu daripada enam pemasangan dalam Pameran Immersive, & Qu

Awan Google semakin serius mengenai infrastruktur pada 2025 seterusnyaApr 25, 2025 am 11:08 AM

Google Cloud's Next 2025: Fokus pada Infrastruktur, Sambungan, dan AI Persidangan seterusnya 2025 Google Cloud mempamerkan banyak kemajuan, terlalu banyak untuk terperinci sepenuhnya di sini. Untuk analisis mendalam mengenai pengumuman khusus, rujuk artikel oleh saya

Bercakap Baby Ai Meme, Paip Filem AI $ 5.5 juta Arcana, penyokong rahsia IR mendedahkanApr 25, 2025 am 11:07 AM

Minggu ini di AI dan XR: Gelombang kreativiti berkuasa AI menyapu melalui media dan hiburan, dari generasi muzik hingga pengeluaran filem. Mari kita menyelam ke tajuk utama. Impak Kandungan Kandungan Ai-Dihasilkan: Perunding Teknologi Shelly Palme

See all articles