1. 程式人生 > >Caffe中網路調參基本套路

Caffe中網路調參基本套路

剛接觸caffe一個多月,感覺迷迷糊糊,最近才稍微明白了點caffe中調參的一些套路,直接上乾貨吧。

1,一般訓練集不大時,最終訓練的網路及容易過擬合,也就是說train-loss一定會收斂,但是test-loss不會收斂;

2,訓練集不大時,儘量選取簡單的網路開始訓練,我用8000張圖片作為訓練集時,網路被簡化到只有一個con,一個pooling,一個全連線;

3,根據train-loss和test-loss曲線判斷網路是否訓練好,最終一個比較理想的模型,其train-loss和test-loss曲線應該幾乎重合,或者非常靠近;

3,根據訓練好的model去測試訓練集和測試集,如果train-error遠小於test-error,那麼該模型一定過擬合,如果test-error和train-error都很大,那麼就是欠擬合了;

4,上條3中一般應該不會出現test-error遠小於train-error的情況,一個比較理想的模型應該是test-error和train-error比較接近;

5,對於過擬合和欠擬合,一般改變網路結構效果會比較明顯;

附帶一張自己訓練的網路曲線圖作參考吧,紅線是test-error,藍線是train-error:

caffe我也是剛入門,還需要積累經驗,只是把自己剛學習的一些淺薄認識記錄出來,以供參考,如有錯誤,歡迎指正!