1. 程式人生 > >Tensorflow中的滑動平均模型

Tensorflow中的滑動平均模型

思想 pan ans color 操作 方法 class 變量 pre

原文鏈接

在Tensorflow的教程裏面,使用梯度下降算法訓練神經網絡時,都會提到一個使模型更加健壯的策略,即滑動平均模型。
基本思想 在使用梯度下降算法訓練模型時,每次更新權重時,為每個權重維護一個影子變量,該影子變量隨著訓練的進行,會最終穩定在一個接近真實權重的值的附近。那麽,在進行預測的時候,使用影子變量的值替代真實變量的值,可以得到更好的結果。 操作步驟
1 訓練階段:為每個可訓練的權重維護影子變量,並隨著叠代的進行更新; 2 預測階段:使用影子變量替代真實變量值,進行預測。

1 滑動平均模型在梯段下降算法上才會有好的結果,別的優化算法沒有這個現象,沒見到合理的解釋。
2 優化的方法有很多,可能這個可以作為最後的提高健壯性的措施。

Tensorflow中的滑動平均模型