Rumah >pembangunan bahagian belakang >Tutorial Python >Penjelasan terperinci tentang peraturan persatuan algoritma apriori

Penjelasan terperinci tentang peraturan persatuan algoritma apriori

DDD
DDDasal
2023-08-10 10:38:022180semak imbas

Peraturan persatuan ialah teknologi penting dalam perlombongan data, yang digunakan untuk menemui perkaitan antara item dalam set data. Langkah-langkah algoritma: 1. Algoritma perlu memulakan set item calon yang mengandungi semua item tunggal 2. Algoritma akan menghasilkan set item calon berdasarkan set item kerap 3. Algoritma akan memangkas set item calon; berpuas hati Set item calon yang diperlukan kemudiannya akan digunakan sebagai set item kerap baharu dan memasuki pusingan lelaran seterusnya 5. Apabila lelaran tamat, algoritma akan memperoleh semua set item kerap yang memenuhi ambang yang ditetapkan. Peraturan persatuan kemudian dijana berdasarkan set item yang kerap.

Penjelasan terperinci tentang peraturan persatuan algoritma apriori

Peraturan persatuan ialah teknologi penting dalam perlombongan data, yang digunakan untuk menemui perkaitan antara item dalam set data. Algoritma apriori peraturan persatuan ialah algoritma yang biasa digunakan untuk peraturan persatuan perlombongan. Prinsip dan langkah algoritma apriori peraturan persatuan akan diperkenalkan secara terperinci di bawah.

Prinsip algoritma

Algoritma apriori peraturan persatuan adalah berdasarkan dua konsep utama: sokongan dan keyakinan. Sokongan mewakili kekerapan set item yang muncul dalam data, manakala keyakinan mewakili kebolehpercayaan peraturan. Idea teras algoritma adalah untuk menjana set item calon daripada set item yang kerap melalui lelaran, mengira sokongan dan keyakinan, dan akhirnya mencari peraturan persatuan yang memenuhi ambang yang ditetapkan.

Langkah algoritma

Langkah algoritma apriori peraturan persatuan adalah seperti berikut:

Initialization

Pertama, algoritma perlu memulakan set item calon yang mengandungi semua item tunggal. Itemset ini dipanggil 1-itemset. Algoritma kemudian mengimbas set data dan mengira sokongan setiap set 1 item.

Jana set item calon

Melalui lelaran, algoritma akan menjana set item calon berdasarkan set item yang kerap. Set item kerap merujuk kepada set item yang sokongannya lebih besar daripada atau sama dengan ambang yang ditetapkan. Dengan mengandaikan bahawa set item kerap bagi lelaran semasa ialah set k-item, maka dengan mengambil penyatuan set k-item dan mengalih keluar item pendua, set k+1-item boleh dijana. Algoritma kemudian mengimbas set data dan mengira sokongan setiap k+1-itemset.

Pemangkasan

Selepas menjana set item calon, algoritma akan memangkas set item calon. Jika subset bagi set item calon bukan set item kerap, maka set item calon tidak boleh menjadi set item kerap. Oleh itu, algoritma memadam set item calon ini yang tidak memenuhi keperluan.

Kemas kini set item yang kerap

Melalui operasi pemangkasan, algoritma memperoleh set item calon yang memenuhi keperluan. Kemudian, algoritma akan menggunakan set item calon ini sebagai set item kerap baharu dan memasuki pusingan lelaran seterusnya.

Jana peraturan persatuan

Apabila lelaran tamat, algoritma akan memperoleh semua set item kerap yang memenuhi ambang yang ditetapkan. Algoritma kemudian menjana peraturan perkaitan berdasarkan set item yang kerap. Peraturan persatuan dijana dengan mengira keyakinan. Untuk set item kerap, peraturan perkaitan berbilang boleh dijana Peraturan perkaitan adalah dalam bentuk A->B, di mana A dan B ialah subset bagi set item kerap.

Pengoptimuman Algoritma

Algoritma apriori peraturan persatuan mungkin menghadapi masalah kerumitan pengiraan yang tinggi apabila memproses set data berskala besar. Untuk mengurangkan kerumitan pengiraan, langkah pengoptimuman berikut boleh diguna pakai:

Mampat set data

Anda boleh memadamkan set item tidak kerap dalam set data dengan memampatkan set data, dengan itu mengurangkan jumlah pengiraan.

Menggunakan Jadual Hash

Anda boleh menggunakan jadual cincang untuk menyimpan set item yang kerap, dengan itu meningkatkan kecekapan carian.

Pangkalan data transaksi

boleh menukar set data ke dalam bentuk pangkalan data transaksi, dan setiap transaksi mewakili set item. Ini boleh mengurangkan bilangan kali set data diimbas dan meningkatkan kecekapan algoritma.

Ringkasnya, algoritma apriori peraturan persatuan ialah algoritma yang biasa digunakan untuk peraturan persatuan melombong. Melalui pendekatan berulang, set item calon dijana daripada set item yang kerap, sokongan dan keyakinan dikira, dan peraturan perkaitan yang memenuhi ambang yang ditetapkan akhirnya ditemui. Untuk mengurangkan kerumitan pengiraan, langkah pengoptimuman seperti memampatkan set data, menggunakan jadual cincang dan pangkalan data transaksi boleh digunakan.

Atas ialah kandungan terperinci Penjelasan terperinci tentang peraturan persatuan algoritma apriori. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn