Rumah >pembangunan bahagian belakang >Tutorial Python >Penjelasan terperinci tentang peraturan persatuan algoritma apriori
Peraturan persatuan ialah teknologi penting dalam perlombongan data, yang digunakan untuk menemui perkaitan antara item dalam set data. Langkah-langkah algoritma: 1. Algoritma perlu memulakan set item calon yang mengandungi semua item tunggal 2. Algoritma akan menghasilkan set item calon berdasarkan set item kerap 3. Algoritma akan memangkas set item calon; berpuas hati Set item calon yang diperlukan kemudiannya akan digunakan sebagai set item kerap baharu dan memasuki pusingan lelaran seterusnya 5. Apabila lelaran tamat, algoritma akan memperoleh semua set item kerap yang memenuhi ambang yang ditetapkan. Peraturan persatuan kemudian dijana berdasarkan set item yang kerap.
Peraturan persatuan ialah teknologi penting dalam perlombongan data, yang digunakan untuk menemui perkaitan antara item dalam set data. Algoritma apriori peraturan persatuan ialah algoritma yang biasa digunakan untuk peraturan persatuan perlombongan. Prinsip dan langkah algoritma apriori peraturan persatuan akan diperkenalkan secara terperinci di bawah.
Prinsip algoritma
Algoritma apriori peraturan persatuan adalah berdasarkan dua konsep utama: sokongan dan keyakinan. Sokongan mewakili kekerapan set item yang muncul dalam data, manakala keyakinan mewakili kebolehpercayaan peraturan. Idea teras algoritma adalah untuk menjana set item calon daripada set item yang kerap melalui lelaran, mengira sokongan dan keyakinan, dan akhirnya mencari peraturan persatuan yang memenuhi ambang yang ditetapkan.
Langkah algoritma
Langkah algoritma apriori peraturan persatuan adalah seperti berikut:
Initialization
Pertama, algoritma perlu memulakan set item calon yang mengandungi semua item tunggal. Itemset ini dipanggil 1-itemset. Algoritma kemudian mengimbas set data dan mengira sokongan setiap set 1 item.
Jana set item calon
Melalui lelaran, algoritma akan menjana set item calon berdasarkan set item yang kerap. Set item kerap merujuk kepada set item yang sokongannya lebih besar daripada atau sama dengan ambang yang ditetapkan. Dengan mengandaikan bahawa set item kerap bagi lelaran semasa ialah set k-item, maka dengan mengambil penyatuan set k-item dan mengalih keluar item pendua, set k+1-item boleh dijana. Algoritma kemudian mengimbas set data dan mengira sokongan setiap k+1-itemset.
Pemangkasan
Selepas menjana set item calon, algoritma akan memangkas set item calon. Jika subset bagi set item calon bukan set item kerap, maka set item calon tidak boleh menjadi set item kerap. Oleh itu, algoritma memadam set item calon ini yang tidak memenuhi keperluan.
Kemas kini set item yang kerap
Melalui operasi pemangkasan, algoritma memperoleh set item calon yang memenuhi keperluan. Kemudian, algoritma akan menggunakan set item calon ini sebagai set item kerap baharu dan memasuki pusingan lelaran seterusnya.
Jana peraturan persatuan
Apabila lelaran tamat, algoritma akan memperoleh semua set item kerap yang memenuhi ambang yang ditetapkan. Algoritma kemudian menjana peraturan perkaitan berdasarkan set item yang kerap. Peraturan persatuan dijana dengan mengira keyakinan. Untuk set item kerap, peraturan perkaitan berbilang boleh dijana Peraturan perkaitan adalah dalam bentuk A->B, di mana A dan B ialah subset bagi set item kerap.
Pengoptimuman Algoritma
Algoritma apriori peraturan persatuan mungkin menghadapi masalah kerumitan pengiraan yang tinggi apabila memproses set data berskala besar. Untuk mengurangkan kerumitan pengiraan, langkah pengoptimuman berikut boleh diguna pakai:
Mampat set data
Anda boleh memadamkan set item tidak kerap dalam set data dengan memampatkan set data, dengan itu mengurangkan jumlah pengiraan.
Menggunakan Jadual Hash
Anda boleh menggunakan jadual cincang untuk menyimpan set item yang kerap, dengan itu meningkatkan kecekapan carian.
Pangkalan data transaksi
boleh menukar set data ke dalam bentuk pangkalan data transaksi, dan setiap transaksi mewakili set item. Ini boleh mengurangkan bilangan kali set data diimbas dan meningkatkan kecekapan algoritma.
Ringkasnya, algoritma apriori peraturan persatuan ialah algoritma yang biasa digunakan untuk peraturan persatuan melombong. Melalui pendekatan berulang, set item calon dijana daripada set item yang kerap, sokongan dan keyakinan dikira, dan peraturan perkaitan yang memenuhi ambang yang ditetapkan akhirnya ditemui. Untuk mengurangkan kerumitan pengiraan, langkah pengoptimuman seperti memampatkan set data, menggunakan jadual cincang dan pangkalan data transaksi boleh digunakan.
Atas ialah kandungan terperinci Penjelasan terperinci tentang peraturan persatuan algoritma apriori. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!