理解 LSTM 时间步长和特征
在给定的 Keras 代码中,trainX 数组的形状为(样本、时间步长、特征) )。这意味着数据被重新整形为三维数组,其中第一维表示样本数,第二维表示时间步数,第三维表示特征数。
在您提供的图表的上下文中,每个绿色框代表一个时间步,每个粉色框代表一个特征。因此,代码正在考虑“多对一”的情况,其中每个绿色框(时间步)有多个粉色框(特征)。
在考虑多元序列时,特征参数变得相关,例如同时对两只金融股票进行建模。在这种情况下,每个特征将代表一只股票,特征的数量将等于正在建模的股票的数量。
了解有状态 LSTM
有状态 LSTM 不会保存批次运行之间的单元内存值。相反,它们在内部跨批次维护其状态。在所提供的代码的情况下,批量大小为 1,LSTM 将根据当前输入更新其内部状态,并使用该状态来处理下一个输入。通过重置训练运行之间的状态,LSTM 被迫在每个批次中重新开始。
这种行为对于预测未来时间步等情况非常重要,其中模型需要记住过去输入的上下文做出准确的预测。
附加说明
以上是Keras LSTM 中的时间步长和特征如何工作?的详细内容。更多信息请关注PHP中文网其他相关文章!