1. 程式人生 > >(Tensorflow之二十三)BATCH_SIZE的計算方法以及取值方法

(Tensorflow之二十三)BATCH_SIZE的計算方法以及取值方法

一、BATCH_SIZE對計算引數的影響

BATCH_SIZE的主要影響到loss以及反向傳播時的遞度計算;在同一批次的訓練中,loss及反向傳播梯度為單個loss及反向傳播遞度的平均值。

二、BATCH_SIZE選取

當BATCH_SIZE過小

例,當BATCH_SIZE為1時,相鄰的兩個樣本之間差異非常大,則會使梯度值過大,導致始終無法收斂;
這裡寫圖片描述

當BATCH_SIZE過大

一方面,計算機記憶體消耗大,可以無法同時計算太大的資料量;
另一方面,變成只有一輪的訓練,無法在多輪的訓練中再次調整資料訓練引數;