Durch die Verwendung von TensorFlow zum Erstellen eines logistischen Regressionsmodells sind die Trainingsergebnisse nan

Question

In TensorFlow möchte ich ein logistisches Regressionsmodell mit der folgenden Kostenfunktion erstellen: Der Screenshot des verwendeten Datensatzes sieht wie folgt aus: Mein Code lautet wie folgt: {code...} Der Screenshot des laufenden Ergebnisses lautet wie folgt: Wie Sie sehen können, erhalten wir nach zwei Iterationen Sowohl W als auch B sind zu Nan geworden. Was ist das Problem?

大家讲道理 · Answer

经过一番搜索，找到了问题所在。

在选取迭代方式的那一句：

optimizer = tf.train.GradientDescentOptimizer(0.1)

这里0.1的学习率过大，导致不知什么原因在损失函数中出现了log(0)的情况，结果导致了损失函数的值为nan，解决方法是减小学习率，比如降到1e-5或者1e-6就可以正常训练了，我根据自己的情况把学习率调整为了1e-3，程序完美运行。

附上最终拟合结果：

Durch die Verwendung von TensorFlow zum Erstellen eines logistischen Regressionsmodells sind die Trainingsergebnisse nan

Antworte allen(1)Ich werde antworten