Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimanakah LSTM Stateful berfungsi dengan saiz kelompok 1?

Bagaimanakah LSTM Stateful berfungsi dengan saiz kelompok 1?

Linda Hamilton
Linda Hamiltonasal
2024-11-05 20:10:03689semak imbas

How do Stateful LSTMs work with a batch size of 1?

Memahami Kenangan Jangka Pendek Jangka Panjang Keras (LSTM)

Membentuk Semula Data dan LSTM Stateful

Membentuk Semula Data

  • Siri data dibentuk semula menjadi [sampel, langkah masa, ciri] untuk membolehkan lapisan LSTM memproses jujukan data siri masa.
  • Langkah masa mewakili bilangan titik masa dalam setiap jujukan, manakala ciri mewakili pembolehubah atau saluran yang berbeza.

LSTM Berstatus

  • LSTM Berstatus mengekalkan keadaan dalaman mereka merentas kelompok, membolehkan mereka mengingati output sebelumnya.
  • Ini berguna untuk tugasan yang konteks daripada langkah masa sebelumnya adalah penting untuk meramalkan peristiwa masa hadapan.

Soalan 1: Langkah dan Ciri Masa

  • Imej dengan kotak merah jambu menggambarkan kes "banyak kepada satu", dengan bilangan kotak hitam (ciri) ialah 3, dan bilangan kotak merah jambu (langkah masa) berubah-ubah.
  • Ini bermakna jujukan input mengandungi 3 ciri setiap langkah masa.

Soalan 2: LSTM Stateful

  • Dalam contoh kod yang disediakan, LSTM stateful digunakan, tetapi batch_size ditetapkan kepada 1.
  • Ini bermakna model dilatih pada satu jujukan pada satu masa dan nilai memori sel ditetapkan semula selepas setiap kelompok.
  • Tujuan menggunakan LSTM stateful adalah untuk mengekalkan konteks merentas langkah masa dalam satu jujukan, walaupun saiz kelompok ialah 1.

Surat-menyurat Imej

  • Rajah Pertama (Dibuka, Saiz Kelompok != 1): Setiap baris mewakili kandungan keadaan dalaman LSTM (kotak oren) dan output ( kotak hijau) pada setiap kali melangkah dalam kelompok.
  • Rajah Kedua (Saiz Kelompok = 1): Serupa dengan rajah pertama, tetapi setiap baris mewakili kandungan keadaan dan output untuk keseluruhan jujukan dalam satu kelompok (saiz kelompok 1).

Nota Tambahan

  • Siri Pelbagai Variasi: Kepada proses siri multivariat, di mana setiap langkah masa mengandungi berbilang ciri, bilangan ciri dalam bentuk semula dan lapisan LSTM hendaklah sama dengan jumlah bilangan ciri dalam data.
  • Lapisan Agihan Masa: Lapisan TimeDistributed boleh digunakan untuk menggunakan transformasi yang sama pada setiap langkah masa dalam urutan, dengan berkesan mencipta lapisan banyak ke banyak.

Atas ialah kandungan terperinci Bagaimanakah LSTM Stateful berfungsi dengan saiz kelompok 1?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn