1. 程式人生 > >TensorFlow神經網路模型不收斂的處理

TensorFlow神經網路模型不收斂的處理

1、learning rate設大了

0.1~0.0001.不同模型不同任務最優的lr都不一樣。

我現在越來越不明白TensorFlow了,我設定訓練次數很大的時候,它一開始就給我“收斂”到一個值,後面的值都一樣。

2、歸一化

一般需要事先對資料進行 歸一化、標準化。歸一化是把所有的列都放到同一標準, 比如 每列減去 該列的均值。
標準化是,對各列之間的波動範圍壓縮到一定區間,比如 每列除於該列的標準差。
python sklearn 的 StandardScaler 可以實現歸一、標準化。

參考: