Rumah  >  Artikel  >  Peranti teknologi  >  Algoritma yang biasa digunakan dalam analisis masa semuanya ada di sini

Algoritma yang biasa digunakan dalam analisis masa semuanya ada di sini

PHPz
PHPzke hadapan
2023-12-15 14:17:541227semak imbas

Analisis siri masa adalah menggunakan ciri-ciri peristiwa dalam tempoh masa lalu untuk meramalkan ciri-ciri peristiwa pada tempoh masa hadapan. Ini adalah masalah pemodelan ramalan yang agak kompleks yang berbeza daripada ramalan model analisis regresi. Model siri masa bergantung pada susunan peristiwa yang berlaku Nilai-nilai yang sama saiz akan menghasilkan keputusan yang berbeza apabila urutan itu diubah masalah siri masa semuanya dianggap sebagai masalah regresi, tetapi kaedah regresi (regresi linear, model pokok , pembelajaran mendalam, dsb.) terdapat perbezaan tertentu.

Algoritma yang biasa digunakan dalam analisis masa semuanya ada di siniAnalisis pemasaan termasuk analisis pemasaan statik (STA) dan analisis pemasaan dinamik.

Berikut ialah beberapa algoritma analisis pemasaan biasa

1 Analisis pemasaan pembelajaran mendalam

RNN (Rangkaian Neural Berulang)

Rangkaian saraf berulang merujuk kepada struktur yang berlaku berulang kali dari semasa ke semasa. Ia mempunyai rangkaian aplikasi yang sangat luas dalam pemprosesan bahasa semula jadi (NLP), imej pertuturan dan bidang lain. Perbezaan terbesar antara rangkaian RNN dan rangkaian lain ialah RNN boleh mencapai "fungsi memori" tertentu dan merupakan pilihan terbaik untuk analisis siri masa. Sama seperti manusia boleh lebih memahami dunia berdasarkan ingatan masa lalu mereka. RNN juga melaksanakan mekanisme yang serupa dengan otak manusia, mengekalkan jumlah memori tertentu untuk maklumat yang diproses, tidak seperti jenis rangkaian saraf lain yang tidak dapat mengekalkan memori untuk maklumat yang diproses.

Kelebihan:

Kaedah ini boleh menghafal masa dan sesuai untuk menyelesaikan masalah dengan selang masa yang singkat dalam siri masa

Keburukan:

Data langkah panjang terdedah kepada masalah letupan kecerunan LS🜜TM. (Rangkaian Ingatan Jangka Pendek Panjang)

LSTM (Memori Jangka Pendek Panjang) ialah rangkaian neural berulang temporal yang direka untuk menyelesaikan masalah pergantungan jangka panjang yang wujud dalam rangkaian saraf berulang konvensional (RNN) . Semua RNN terdiri daripada satu siri modul rangkaian saraf berulang

Kekuatan:

Sesuai untuk memproses dan meramal peristiwa penting dengan selang masa yang sangat lama dan kelewatan dalam siri masa.

Kelemahan:

Terlalu banyak parameter model akan membawa kepada masalah overfitting

2 Model analisis siri masa tradisional

Auto Regresi (AR)

🜎🜎 Purata

Purata Pergerakan Autoregresif (ARMA)
  • Purata Pergerakan Bersepadu Autoregresif (ARIMA)
  • Purata Pergerakan Bersepadu Autoregresif Bermusim (Purata Pergerakan Bersepadu Autoregresif Bermusim, SARIMA) ving-Average dengan Exogenous Regressors ( SARIMAX)
  • Model autoregresif AR
  • Model Autoregresif (pendek kata model AR) ialah kaedah analisis siri masa yang digunakan untuk menerangkan hubungan antara pembolehubah siri masa dan nilai masa lalunya. Model AR menganggap hubungan linear antara pemerhatian semasa dan pemerhatian lepas, dan menggunakan pemerhatian lepas untuk meramalkan pemerhatian masa hadapan.
  • Kekuatan:
  • Kesederhanaan: Model AR ialah model linear yang mudah difahami dan dilaksanakan. Ia hanya menggunakan pemerhatian lepas sebagai pembolehubah bebas, tanpa faktor kompleks lain untuk dipertimbangkan.
Keupayaan pemodelan: Model AR boleh menangkap struktur autokorelasi data siri masa, iaitu, hubungan antara pemerhatian semasa dan pemerhatian lepas. Ia menyediakan ramalan pemerhatian masa depan dan mendedahkan trend dan corak dalam data.

Kelemahan:

  • Hanya terpakai untuk siri pegun: Model AR memerlukan siri masa adalah pegun, iaitu min, varians dan autokorelasi tidak berubah mengikut masa. Jika siri ini tidak pegun, anda mungkin perlu melakukan operasi pembezaan atau menggunakan model lain untuk mengendalikan tidak pegun.
  • Sensitif kepada pemerhatian lepas: Keputusan ramalan model AR dipengaruhi oleh pemerhatian lepas, jadi masalah pengumpulan ralat mungkin berlaku apabila berurusan dengan ramalan jangka panjang. Susunan yang lebih besar mungkin membawa kepada pemadanan model, manakala susunan yang lebih kecil mungkin tidak menangkap dinamik kompleks siri masa.
  • Tidak boleh mengendalikan data bermusim: Model AR tidak boleh mengendalikan siri masa secara langsung dengan bermusim yang jelas. Untuk data dengan corak bermusim, model AR bermusim (SAR) atau model ARIMA boleh digunakan untuk pemodelan.

Kaedah Purata Bergerak (MA)

Kaedah Purata Bergerak (MA): Kaedah ini berdasarkan purata data dan menganggap kestabilan tertentu antara nilai masa hadapan dan nilai masa lalu

Kekuatan :

Menangkap perhubungan purata bergerak dalam data siri masa. Model MA menggunakan gabungan linear istilah ralat hingar putih dari langkah masa lalu untuk meramalkan pemerhatian semasa dan oleh itu menangkap sifat purata bergerak dalam data.

Agak mudah dan intuitif. Parameter model MA mewakili berat terma ralat hingar putih pada langkah masa lalu, dan model boleh dipasang dengan menganggarkan pemberat ini.

Kelemahan:

  • hanya boleh menangkap perhubungan purata bergerak dan tidak boleh menangkap perhubungan autoregresif. Model MA mengabaikan pemerhatian langkah masa lalu dan mungkin tidak menangkap autokorelasi dalam data.
  • Untuk beberapa data siri masa, model MA mungkin memerlukan susunan yang lebih tinggi untuk memuatkan data dengan baik, menyebabkan kerumitan model meningkat.

Model Purata Pergerakan Autoregresif

Model Purata Pergerakan Autoregresif (model ARMA, Auto-Regression dan Moving AverageModel) ialah kaedah penting untuk mengkaji siri masa Ia terdiri daripada model autoregresif (model AR) dan model purata bergerak ). model) sebagai asas, ia mempunyai ciri-ciri julat aplikasi yang luas dan ralat ramalan kecil.

Autoregressive Integrated Moving Average (ARIMA)

Model ARIMA ialah singkatan model Autoregressive Differential Moving Average, nama penuhnya ialah Autoregressive Integrated Moving Average Model. Model ini terutamanya terdiri daripada tiga bahagian, iaitu model autoregresif (AR), proses perbezaan (I) dan model purata bergerak (MA) Idea asas model ARIMA adalah menggunakan maklumat sejarah data itu sendiri untuk meramal masa depan. Nilai teg pada satu masa dipengaruhi oleh kedua-dua nilai teg dalam tempoh yang lalu dan peristiwa yang tidak disengajakan dalam tempoh yang lalu Dalam erti kata lain, model ARIMA mengandaikan bahawa nilai teg berubah-ubah mengikut arah aliran masa arah aliran dipengaruhi oleh label sejarah, turun naik dipengaruhi oleh peristiwa tidak sengaja dalam tempoh masa, dan arah aliran umum itu sendiri tidak semestinya stabil

Model ARIMA ialah kaedah analisis siri masa yang menganalisis data mengikut Model autokorelasi dan perbezaan kepada ekstrak corak siri masa yang tersembunyi dalam data, dan kemudian ramalkan data masa hadapan

Bahagian AR digunakan untuk memproses bahagian autoregresif siri masa, yang mengambil kira pemerhatian beberapa tempoh lalu Kesan nilai pada nilai semasa.

  • Bahagian I digunakan untuk membuat pegun siri masa tidak pegun Melalui pemprosesan perbezaan tertib pertama atau kedua, trend dan faktor bermusim dalam siri masa dihapuskan.
  • Bahagian MA digunakan untuk memproses bahagian purata bergerak siri masa, yang mengambil kira kesan ralat ramalan masa lalu ke atas nilai semasa.
  • Menggabungkan ketiga-tiga bahagian ini, model ARIMA bukan sahaja dapat menangkap perubahan trend data, tetapi juga mengendalikan data dengan perubahan sementara, mendadak atau bunyi yang besar. Oleh itu, model ARIMA berprestasi baik dalam banyak masalah ramalan siri masa.

Kekuatan:

Pembinaan model adalah sangat mudah, hanya menggunakan pembolehubah endogen tanpa menggunakan pembolehubah eksogen yang lain. Apa yang dipanggil pembolehubah endogen merujuk kepada pembolehubah yang hanya bergantung pada data itu sendiri, tidak seperti model regresi yang memerlukan sokongan pembolehubah lain

Kelemahan:

Data siri masa diperlukan untuk menjadi stabil, atau menjadi stabil selepas pemprosesan pembezaan

Pada asasnya, ia hanya boleh menangkap hubungan linear, tetapi bukan hubungan bukan linear.

Model Purata Pergerakan Bersepadu Autoregresif Bermusim SARIMA

SARIMA ialah kaedah analisis siri masa yang biasa digunakan, yang merupakan lanjutan daripada model ARIMA pada data bermusim. Model SARIMA boleh digunakan untuk meramalkan data siri masa bermusim, seperti jualan tahunan atau lawatan tapak web mingguan. Berikut adalah kelebihan dan kekurangan model SARIMA:

Kekuatan:

  • Model SARIMA boleh mengendalikan data bermusim dengan baik kerana ia mengambil kira faktor bermusim dalam data siri masa.
  • Model SARIMA boleh membuat ramalan jangka panjang pada data siri masa kerana ia boleh menangkap arah aliran dan perubahan kitaran dalam data.
  • Model SARIMA boleh digunakan untuk data siri masa berbilang pembolehubah kerana ia boleh mempertimbangkan hubungan antara berbilang pembolehubah pada masa yang sama.

Kelemahan:

  • Model SARIMA memerlukan sejumlah besar data sejarah untuk dilatih, jadi mungkin tidak sesuai apabila jumlah data adalah kecil.
  • Model SARIMA sensitif kepada outlier, jadi outlier perlu diproses.
  • Model SARIMA mempunyai kerumitan pengiraan yang tinggi dan memerlukan banyak pengiraan dan pengoptimuman.

Model purata bergerak bersepadu autoregresif bermusim SARIMAX dengan regressor eksogen

Model purata bergerak bersepadu autoregresif bermusim (SARIMAX) adalah berdasarkan model autoregresif bergerak pembezaan (ARIMA) serta model Regressor eksogen. Ia sesuai untuk data siri masa dengan ciri-ciri berkala dan bermusim yang jelas

3 Model siri masa yang lain

Kaedah jenis ini diwakili oleh lightgbm dan xgboost Secara amnya, masalah siri masa ditukar kepada pembelajaran diselia, dan melalui ciri kejuruteraan dan kaedah Pembelajaran mesin untuk meramalkan model ini boleh menyelesaikan model ramalan siri masa yang paling kompleks. Menyokong pemodelan data yang kompleks, regresi kolaboratif berbilang pembolehubah dan masalah tak linear.

Kepentingan kejuruteraan ciri adalah jelas dan ia memainkan peranan penting dalam kejayaan pembelajaran mesin. Walau bagaimanapun, kejuruteraan ciri bukanlah tugas yang mudah dan memerlukan pemprosesan manual yang kompleks dan kepakaran unik. Tahap kejuruteraan ciri selalunya menentukan had atas pembelajaran mesin, dan algoritma pembelajaran mesin adalah sehampir mungkin dengan had atas ini. Setelah kejuruteraan ciri selesai, kami boleh terus menggunakan algoritma model pokok - lightgbm dan xgboost. Kedua-dua model ini adalah kaedah pemodelan yang sangat biasa dan cekap. Di samping itu, mereka juga mempunyai ciri-ciri berikut:

  • pengiraan pantas dan ketepatan model yang tinggi
  • nilai yang hilang tidak perlu diproses, yang mana lebih mudah
  • pembolehubah;
  • sokong Persilangan ciri.

Kaedah khusus untuk dipilih perlu dipertimbangkan secara menyeluruh berdasarkan sifat data, ciri-ciri masalah, dan pengalaman dan kebolehan anda sendiri.

Anda perlu memilih kaedah ramalan siri masa yang sesuai berdasarkan ciri data tertentu, keperluan masalah dan keupayaan anda sendiri. Kadangkala, menggabungkan pelbagai kaedah boleh meningkatkan ketepatan dan kestabilan ramalan. Pada masa yang sama, untuk memilih model dengan lebih baik dan menilai keputusan ramalan, adalah penting juga untuk melakukan analisis visual data dan diagnosis model.

Atas ialah kandungan terperinci Algoritma yang biasa digunakan dalam analisis masa semuanya ada di sini. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam