Rumah >Peranti teknologi >AI >Penguraian matriks Poisson: Algoritma penguraian matriks yang menyelesaikan masalah permulaan sejuk sistem pengesyoran tanpa data

Penguraian matriks Poisson: Algoritma penguraian matriks yang menyelesaikan masalah permulaan sejuk sistem pengesyoran tanpa data

WBOY
WBOYke hadapan
2023-04-14 10:31:02918semak imbas

Pengarang |. Wang Hao

Penilai |. Dalam dekad yang lalu, industri Internet telah menghasilkan berjuta-juta versi berulang model sistem pengesyoran. Walaupun terdapat banyak model sistem pengesyoran yang dioptimumkan untuk senario yang berbeza, terdapat sangat sedikit model klasik. Penguraian matriks ialah algoritma sistem pengesyoran yang muncul pada masa awal bidang sistem pengesyoran dan menunjukkan keunggulannya dalam persaingan Netflix Ia juga merupakan algoritma sistem pengesyoran yang paling berjaya dalam sepuluh tahun yang lalu. Walaupun pada hari ini pada tahun 2023, bidang sistem pengesyoran telah lama dikuasai oleh pembelajaran mendalam, penguraian matriks masih digunakan secara meluas dalam proses penyelidikan dan pembangunan syarikat utama, dan masih terdapat ramai penyelidik saintifik yang bekerja pada algoritma berkaitan.

Penguraian matriks Poisson: Algoritma penguraian matriks yang menyelesaikan masalah permulaan sejuk sistem pengesyoran tanpa data

Kertas paling klasik tentang algoritma pemfaktoran matriks ialah Pemfaktoran Matriks Kebarangkalian 2007. Atas dasar ini, generasi kemudian telah menjalankan banyak kerja pengembangan, seperti RankMat pada 2021 (alamat muat turun kertas: https://arxiv.org/abs/2204.13016), ZeroMat (alamat muat turun kertas: https://arxiv. org /abs/2112.03084) dan DotMat pada 2022 (alamat muat turun kertas: https://arxiv.org/abs/2206.00151), KL-Mat (alamat muat turun kertas: https://arxiv.org/abs/2204.13583/ muat turun kod Alamat: https://github.com/haow85/KL-Mat), dsb. Sistem pengesyoran amat disukai oleh jurutera dalam industri Internet kerana kesederhanaan, kemudahan penggunaan dan kelajuan yang pantas.

Masalah permulaan sejuk sistem pengesyoran adalah satu lagi kawasan penyelidikan yang telah menarik perhatian ramai pada tahun ini. Banyak idea pengamal untuk menyelesaikan sistem pengesyoran ialah pemindahan pembelajaran dan meta-pembelajaran. Walau bagaimanapun, idea ini mempunyai kelemahan yang membawa maut, iaitu ia memerlukan data dari bidang pengetahuan lain. Banyak syarikat tidak memenuhi syarat ini. Algoritma permulaan sejuk, yang benar-benar tidak memerlukan sebarang data, muncul selepas ZeroMat dicadangkan pada tahun 2021. Algoritma perwakilan termasuk ZeroMat dan DotMat yang disebutkan dalam bahagian sebelumnya. Algoritma penguraian matriks Poisson (PoissonMat) yang akan diperkenalkan dalam artikel ini ialah kertas kerja yang diterbitkan pada Persidangan Akademik Antarabangsa 2022 MLISE 2022. Nama kertas itu ialah PoissonMat: Pemfaktoran Matriks Ubahsuai menggunakan Taburan Poisson dan Menyelesaikan Masalah Permulaan Dingin tanpa Data Input (alamat muat turun kertas: https://arxiv.org/abs/2212.10460).

Kami mula-mula menyemak definisi MAP bagi Pemfaktoran Matriks Kebarangkalian:

Penguraian matriks Poisson: Algoritma penguraian matriks yang menyelesaikan masalah permulaan sejuk sistem pengesyoran tanpa data

Kami kemudiannya mentakrifkan gelagat pengguna untuk menjaringkan item sebagai MAP diedarkan secara longgar. Mengikut takrifan taburan Poisson, kita mendapat formula berikut:

Penguraian matriks Poisson: Algoritma penguraian matriks yang menyelesaikan masalah permulaan sejuk sistem pengesyoran tanpa data

Mengikut takrifan parameter dalam formula Poisson, kita ada:

Penguraian matriks Poisson: Algoritma penguraian matriks yang menyelesaikan masalah permulaan sejuk sistem pengesyoran tanpa data

Mengikut pengedaran Zipf, kita boleh mendapatkan formula berikut:

Penguraian matriks Poisson: Algoritma penguraian matriks yang menyelesaikan masalah permulaan sejuk sistem pengesyoran tanpa data

Untuk merumuskan Formula di atas, kami mendapat bentuk analisis penguraian matriks Poisson (PoissonMat):

Penguraian matriks Poisson: Algoritma penguraian matriks yang menyelesaikan masalah permulaan sejuk sistem pengesyoran tanpa data

Menggunakan algoritma penurunan kecerunan stokastik untuk menyelesaikan formula di atas, kami mendapat aliran algoritma berikut :

Penguraian matriks Poisson: Algoritma penguraian matriks yang menyelesaikan masalah permulaan sejuk sistem pengesyoran tanpa data

Pengarang kemudian menjalankan perbandingan eksperimen ketepatan dan keadilan algoritma pada MovieLens 1 Million Dataset dan Set Data LDOS-CoMoDa:

Penguraian matriks Poisson: Algoritma penguraian matriks yang menyelesaikan masalah permulaan sejuk sistem pengesyoran tanpa data

Penguraian matriks Poisson: Algoritma penguraian matriks yang menyelesaikan masalah permulaan sejuk sistem pengesyoran tanpa data

Rajah 1 Percubaan perbandingan penguraian matriks Poisson pada MovieLens 1 Million Dataset

Penguraian matriks Poisson: Algoritma penguraian matriks yang menyelesaikan masalah permulaan sejuk sistem pengesyoran tanpa data

Penguraian matriks Poisson: Algoritma penguraian matriks yang menyelesaikan masalah permulaan sejuk sistem pengesyoran tanpa data

Rajah 2 Percubaan perbandingan penguraian matriks Poisson pada Set Data LDOS-CoMoDa

Berdasarkan keputusan perbandingan eksperimen, kita boleh membuat kesimpulan berikut : Pemfaktoran matriks Poisson (PoissonMat) mengatasi algoritma lain dalam kedua-dua metrik ketepatan dan kesaksamaan. Apa yang patut dipuji ialah algoritma penguraian matriks Poisson tidak menggunakan sebarang data input dan merupakan algoritma pembelajaran sifar pukulan lengkap, yang menyelesaikan masalah permulaan sejuk dengan baik.

Akhirnya, penulis menjalankan eksperimen pada komputer riba rumah Lenovo dengan 16G RAM dan Intel Core i5 Algoritma berjalan dengan sangat pantas dan pelaksanaannya sangat mudah.

Algoritma pembelajaran sifar pukulan, yang bertujuan untuk menyelesaikan masalah permulaan dingin sistem pengesyoran, kini merupakan tempat liputan penyelidikan. Algoritma pembelajaran sifar pukulan sebenar yang tidak memerlukan sebarang data untuk menyelesaikan masalah pembelajaran pukulan sifar, bermula daripada algoritma ZeroMat pada 2021. Algoritma penguraian matriks Poisson (PoissonMat) yang diperkenalkan dalam artikel ini berprestasi lebih baik daripada ZeroMat dan algoritma seterusnya DotMat, dan kini merupakan salah satu algoritma terbaik dalam bidang ini. Memandangkan penyelidikan berkaitan masih di peringkat awal, kami berharap ia akan menarik perhatian dan perhatian majoriti pengamal sains dan teknologi.

Pengenalan kepada pengarang

Wang Hao, bekas ketua Makmal Kepintaran Buatan Funplus dan bekas ketua Jabatan Data Besar Hengchang Litong. Lulus dari Universiti Utah di Amerika Syarikat dengan ijazah sarjana muda (2008) dan ijazah sarjana (2010). Sambilan MBA daripada Universiti Perniagaan dan Ekonomi Antarabangsa (2016). Dalam sistem pengesyoran (kesaksamaan/pengesyoran berasaskan senario/permulaan dingin/kebolehtafsiran/pembelajaran kedudukan), grafik komputer (pemodelan geometri/visualisasi), pemprosesan bahasa semula jadi (aplikasi pelaksanaan dalam industri), kawalan risiko dan anti-penipuan ( Kewangan/perubatan) dan arah lain dengan pengalaman bertahun-tahun dan cerapan unik. Beliau mempunyai 12 tahun pengalaman R&D dan pengurusan teknologi dalam Internet (Douban, Baidu, Sina, NetEase, dll.), teknologi kewangan (Hengchang Litong) dan syarikat permainan (Funplus, dll.). Menerbitkan 30 kertas kerja dalam persidangan dan jurnal akademik antarabangsa, dan memenangi 3 persidangan antarabangsa Anugerah Kertas Terbaik/Anugerah Laporan Kertas Terbaik (Anugerah Kertas Terbaik IEEE SMI 2008/Anugerah Persembahan Lisan Terbaik ICBDT 2020/Anugerah Persembahan Lisan Terbaik ICISCAE 2021). Pingat Emas Pertandingan Serantau Gunung Rocky Amerika Utara ACM/ICPC 2006. Pingat Gangsa 2004 dalam Pertuturan Akhir Pertandingan Kemahiran Bahasa Inggeris Kolej Kebangsaan. Pada tahun 2003, beliau memenangi tempat pertama dalam Bahasa Inggeris dalam bidang sains dan kejuruteraan dalam Peperiksaan Masuk Kolej Jinan.

Atas ialah kandungan terperinci Penguraian matriks Poisson: Algoritma penguraian matriks yang menyelesaikan masalah permulaan sejuk sistem pengesyoran tanpa data. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam