Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimanakah Langkah dan Ciri Masa Mempengaruhi Prestasi Model LSTM dan Latihan Stateful?

Bagaimanakah Langkah dan Ciri Masa Mempengaruhi Prestasi Model LSTM dan Latihan Stateful?

DDD
DDDasal
2024-11-25 18:13:27865semak imbas

How Do Time Steps and Features Affect LSTM Model Performance and Stateful Training?

Memahami Langkah dan Ciri Masa LSTM

Dalam model LSTM, langkah dan ciri masa merujuk kepada dimensi data input. Langkah masa mewakili bilangan titik data dalam jujukan, manakala ciri mewakili pembolehubah atau dimensi yang berbeza dalam setiap titik data.

Dalam contoh anda, data input dibentuk semula menjadi tatasusunan 3D dengan dimensi berikut:

  • Sampel (saiz kelompok)
  • Langkah masa (panjang jujukan, dalam kes ini 3)
  • Ciri (bilangan pembolehubah input, dalam kes ini 1)

Oleh itu, setiap sampel ialah urutan 3 titik data, dengan setiap titik data terdiri daripada satu input berubah-ubah.

Stateful LSTM

Stateful LSTM mengekalkan keadaan tersembunyi yang dikemas kini pada setiap langkah masa. Ini membolehkan model belajar daripada input lepas dan membuat ramalan berdasarkan konteks. Apabila stateful=True, LSTM akan mengingati keadaan tersembunyi antara kelompok, yang boleh berguna untuk data berjujukan.

Dalam kod anda, anda menggunakan saiz kelompok 1 dan melatih model selama 100 zaman. Walau bagaimanapun, anda juga menetapkan semula keadaan selepas setiap zaman dengan model.reset_states(). Ini bermakna model itu sebenarnya tidak belajar daripada input lepas antara kelompok, dan pada asasnya ia menganggap setiap kelompok sebagai urutan baharu.

Untuk melatih LSTM berstatus dengan betul, anda harus mengelak daripada menetapkan semula keadaan semasa latihan. Sebaliknya, anda hanya perlu menetapkan semula keadaan apabila anda ingin memulakan jujukan baharu atau membuat ramalan pada titik data baharu.

Rajah Terbuka

Rajah yang anda berikan menggambarkan seni bina rangkaian LSTM yang dibuka. Dalam kedua-dua kes, kotak merah mewakili langkah input, dan kotak hijau mewakili keadaan tersembunyi.

Edit 1:

Rajah berikut sepadan dengan gambar rajah pertama yang dibuka. anda sediakan:

[Imej gambarajah yang dibongkar dengan satu langkah input setiap langkah masa]

Rajah yang anda berikan sepadan dengan gambar rajah terbongkar kedua:

[Imej gambar rajah yang dibuka dengan semua langkah input serentak]

Edit 2:

Memahami masa langkah dan hujah ciri adalah penting untuk model LSTM. Rujuk sumber yang disediakan dalam siaran asal dan ulasan untuk penjelasan lanjut.

Nota Tambahan:

  • Lapisan LSTM boleh memproses data dalam pelbagai bentuk, termasuk satu konfigurasi -kepada-banyak, banyak-ke-satu dan banyak-ke-banyak.
  • Anda boleh mencapai konfigurasi yang berbeza dengan melaraskan hujah return_sequences.
  • Siaran asal juga mengandungi maklumat berharga tentang menggunakan LSTM stateful untuk tugasan ramalan langkah masa hadapan.

Atas ialah kandungan terperinci Bagaimanakah Langkah dan Ciri Masa Mempengaruhi Prestasi Model LSTM dan Latihan Stateful?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn