>백엔드 개발 >파이썬 튜토리얼 >시간 단계와 기능이 LSTM 모델 성능과 상태 저장 훈련에 어떤 영향을 미치나요?

시간 단계와 기능이 LSTM 모델 성능과 상태 저장 훈련에 어떤 영향을 미치나요?

DDD
DDD원래의
2024-11-25 18:13:27867검색

How Do Time Steps and Features Affect LSTM Model Performance and Stateful Training?

LSTM 시간 단계 및 특징 이해

LSTM 모델에서 시간 단계 및 특징은 입력 데이터의 차원을 나타냅니다. 시간 단계는 시퀀스의 데이터 포인트 수를 나타내고 기능은 각 데이터 포인트 내의 다양한 변수 또는 차원을 나타냅니다.

예제에서 입력 데이터는 다음 차원을 사용하여 3D 배열로 재구성됩니다.

  • 샘플(배치 크기)
  • 시간 단계(시퀀스 길이, 이 경우 3)
  • 특징(입력 변수 수, 이 경우 1)

따라서 각 샘플은 3개의 데이터 포인트의 시퀀스이며 각 데이터 포인트는 단일 입력으로 구성됩니다. 변수.

상태 저장 LSTM

상태 저장 LSTM은 각 시간 단계에서 업데이트되는 숨겨진 상태를 유지합니다. 이를 통해 모델은 과거 입력으로부터 학습하고 상황에 따라 예측할 수 있습니다. stateful=True인 경우 LSTM은 배치 간의 숨겨진 상태를 기억하므로 순차 데이터에 유용할 수 있습니다.

코드에서 배치 크기 1을 사용하고 100세대 동안 모델을 훈련합니다. 그러나 model.reset_states()를 사용하여 각 에포크 후에 상태를 재설정할 수도 있습니다. 이는 모델이 배치 간의 과거 입력으로부터 실제로 학습하지 않고 기본적으로 각 배치를 새로운 시퀀스로 처리한다는 것을 의미합니다.

상태 저장 LSTM을 올바르게 훈련하려면 훈련 중에 상태를 재설정하지 않아야 합니다. 대신, 새 시퀀스를 시작하거나 새 데이터 포인트에 대해 예측하려는 경우에만 상태를 재설정해야 합니다.

펼쳐진 다이어그램

제공한 다이어그램 LSTM 네트워크의 펼쳐진 아키텍처를 보여줍니다. 두 경우 모두 빨간색 상자는 입력 단계를 나타내고 녹색 상자는 숨겨진 상태를 나타냅니다.

편집 1:

다음 다이어그램은 첫 번째 펼쳐진 다이어그램에 해당합니다. 귀하가 제공한 내용:

[시간 단계당 하나의 입력 단계가 있는 펼쳐진 다이어그램 이미지]

귀하가 제공한 다이어그램 두 번째 펼쳐진 다이어그램에 해당:

[모든 입력 단계가 동시에 포함된 펼쳐진 다이어그램 이미지]

편집 2:

시간 단계 이해 기능 인수는 LSTM 모델에 필수적입니다. 자세한 내용은 원본 게시물과 댓글에 제공된 리소스를 참조하세요.

추가 참고 사항:

  • LSTM 레이어는 다음을 포함하여 다양한 형식의 데이터를 처리할 수 있습니다. -대다, 다대일, 다대다 구성.
  • 다음을 통해 다양한 구성을 달성할 수 있습니다. return_sequences 인수를 조정합니다.
  • 원본 게시물에는 향후 단계 예측 작업에 상태 저장 LSTM을 사용하는 방법에 대한 귀중한 정보도 포함되어 있습니다.

위 내용은 시간 단계와 기능이 LSTM 모델 성능과 상태 저장 훈련에 어떤 영향을 미치나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.