Rumah > Artikel > Peranti teknologi > Ramalan siri masa berbilang variasi: ramalan bebas atau ramalan bersama?
Hari ini saya memperkenalkan artikel yang diterbitkan oleh NTU pada bulan April tahun ini terutamanya membincangkan perbezaan antara kesan ramalan bebas (bebas saluran) dan ramalan bersama (bergantung saluran) dalam masalah ramalan siri masa multivariate, sebab di sebaliknya. dan kaedah pengoptimuman.
Tajuk kertas: The Capacity and Robustness Trade-off: Mengkaji Semula Strategi Bebas Saluran untuk Ramalan Siri Masa Pelbagai Variasi
Alamat muat turun : https://arxiv.org/pdf/2304.05206v1.pdf
Dalam masalah ramalan siri masa multivariate, dimensi kaedah pemodelan berbilang pembolehubah ialah: Terdapat adalah dua jenis, satu ialah ramalan bebas (bebas saluran, CI), yang merujuk kepada merawat jujukan multivariat sebagai ramalan univariat berbilang, dan setiap pembolehubah dimodelkan secara berasingan (bergantung saluran, CD), yang merujuk kepada Ia adalah untuk memodelkan pelbagai pembolehubah bersama-sama dan mempertimbangkan hubungan antara setiap pembolehubah. Perbezaan antara keduanya adalah seperti yang ditunjukkan di bawah.
Kedua-dua kaedah mempunyai ciri-ciri tersendiri: kaedah CI hanya mempertimbangkan pembolehubah tunggal, modelnya lebih mudah, tetapi silingnya juga lebih rendah, kerana hubungan antara setiap urutan tidak dianggap hubungan, kehilangan sebahagian daripada maklumat utama manakala kaedah CD mempertimbangkan maklumat yang lebih komprehensif, tetapi model juga lebih kompleks;
Mula-mula menjalankan eksperimen perbandingan terperinci dan gunakan model linear untuk memerhati kesan kaedah CI dan kaedah CD pada beberapa set data untuk tentukan kaedah mana cara yang lebih baik. Dalam eksperimen dalam artikel ini, kesimpulan utama ialah kaedah CI menunjukkan prestasi yang lebih baik pada kebanyakan tugas dan mempunyai kestabilan kesan yang lebih kukuh. Seperti yang dapat dilihat dalam gambar di bawah, MAE CI, MSE dan penunjuk lain pada dasarnya lebih kecil daripada CD dalam setiap set data, dan turun naik kesannya juga lebih kecil.
Seperti yang dapat dilihat daripada keputusan percubaan di bawah, berbanding dengan CD, CI mempunyai kesan yang sama pada kebanyakan panjang tetingkap ramalan dan set data yang dinaikkan .
Mengapa kaedah CI lebih baik dan lebih stabil daripada CD dalam aplikasi praktikal? Artikel itu menjalankan beberapa bukti teori, dan kesimpulan terasnya ialah hanyut pengedaran sering wujud dalam data sebenar, dan menggunakan kaedah CI boleh membantu mengurangkan masalah ini dan meningkatkan generalisasi model. Gambar di bawah menunjukkan taburan ACF (pekali autokorelasi, mencerminkan hubungan antara jujukan masa hadapan dan jujukan sejarah) bagi setiap set kereta api set data dan set ujian dari semasa ke semasa Anda boleh melihat bahawa Drift Pengedaran tersebar luas dalam pelbagai set data (iaitu ACF set kereta api berbeza daripada ACF set ujian, iaitu hubungan antara sejarah dan urutan masa depan kedua-duanya adalah berbeza).
Artikel membuktikan melalui teori bahawa CI berkesan dalam mengurangkan Distribution Drift Pilihan antara CI dan CD ialah sejenis kapasiti model dan keteguhan model Pertukaran antara kelekatan. Walaupun model CD lebih kompleks, ia juga lebih sensitif terhadap anjakan pengedaran. Ini sebenarnya serupa dengan hubungan antara kapasiti model dan generalisasi model Lebih kompleks model, lebih tepat sampel set latihan yang sesuai dengan model, tetapi generalisasi adalah lemah Apabila perbezaan taburan antara set latihan dan set ujian adalah besar, kesannya akan menjadi lebih teruk.
Mensasarkan masalah pemodelan CD, artikel ini mencadangkan beberapa kaedah pengoptimuman yang boleh membantu model CD menjadi lebih mantap.
Regulasi: Memperkenalkan kerugian regularisasi, gunakan jujukan tolak titik sampel terdekat sebagai model input jujukan sejarah untuk ramalan, dan gunakan pelicinan untuk mengekang hasil ramalan supaya hasil ramalan tidak menyimpang terlalu banyak daripada nilai pemerhatian jiran terdekat. Besar, menjadikan hasil anggaran lebih rata; matriks, yang bersamaan dengan mengurangkan Meningkatkan kapasiti model, mengurangkan masalah pemasangan berlebihan, dan meningkatkan keteguhan model
Fungsi kehilangan: Gunakan MAE dan bukannya MSE untuk mengurangkan sensitiviti model kepada outlier;
Panjang jujukan input sejarah: Untuk model CD, semakin panjang jujukan sejarah input, kesannya mungkin dikurangkan Ini juga kerana semakin panjang jujukan sejarah, model lebih terdedah kepada pengaruh Anjakan Agihan model CI, pertumbuhan panjang jujukan sejarah boleh menjadi agak stabil.
Dalam artikel ini, kaedah yang disebutkan di atas untuk menambah baik model CD telah diuji pada beberapa set data Berbanding dengan CD, peningkatan kesan yang agak stabil telah dicapai, menunjukkan bahawa perkara di atas Kaedah ini berguna untuk meningkatkan jujukan multivariate keteguhan ramalan mempunyai kesan yang agak jelas. Keputusan eksperimen menunjukkan bahawa faktor seperti penguraian peringkat rendah, panjang tetingkap sejarah dan jenis fungsi kehilangan juga disenaraikan dalam artikel dari segi mempengaruhi kesan.
Atas ialah kandungan terperinci Ramalan siri masa berbilang variasi: ramalan bebas atau ramalan bersama?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!