ホームページ  >  に質問  >  本文

モデルが収束しないのはなぜですか?

モデルが収束しないのはなぜですか?

モデルが収束しないのはなぜですか?

モデルが収束しないのはなぜですか?

人工智能技术与咨询人工智能技术与咨询731日前771

全員に返信(1)返信します

  • 人工智能技术与咨询

    人工智能技术与咨询2022-09-07 11:31:04

    1. 逆伝播チェーンが壊れています。つまり、変数の一部が numpy 配列に変換されている可能性があります。変数は引き続き計算に参加できますが、勾配を伝播する能力を失い、その結果、勾配を次の値に伝播できなくなります。 2. 学習率 設定が無理 学習率を大きくしすぎると損失がnanになりやすくモデルが収束しなくなる 小さすぎるとモデルが学習してしまう3. パラメータの初期化はモデルのトレーニング速度に影響するため、ニューラル ネットワーク層のパラメータは適切に初期化されていません。

    返事
    0
  • キャンセル返事