caffe 超引數設定
阿新 • • 發佈:2018-11-27
文章目錄
寫在前面
caffe的超引數文字是caffe非常重要的一個檔案,它是caffe訓練網路的一個入口
solver.prototxt
test_iter: 580 test_interval: 4420 base_lr: 0.001 display: 278 max_iter: 88400 lr_policy: "poly" power: 1.0 momentum: 0.9 weight_decay: 1e-05 snapshot: 8840 snapshot_prefix: "snapshot" solver_mode: GPU net: "train_val.prototxt" solver_type: NESTEROV
引數含義的描述:
test_iter 測試的批次數 test_iter*batch_size = test-data 總測試樣本資料。 例如mnist資料集中訓練資料50000,測試資料10000,所以我們可以設定batch_size為100,則需要迭代100次才能將10000個數據全部執行完,因此,將test_iter設定為100。執行完一次全部資料,稱之為一個epoch。
test_interval 測試間隔,每訓練多少次進行一次測試
base_lr 學習率設定
lr_policy 設定策略調整
- fixed: 保持base_lr不變
- step: 階梯衰減 base_lr * gamma ^ (floor(iter / step)) 【需要gamma 和 step】
- exp 指數衰減 base_lr * gamma ^ iter 【需要gamma】
- inv 倒數衰減 base_lr * (1 + gamma * iter) ^ (- power) 【需要gamma 和 power】
- multistep similar to step but it allows non uniform steps defined by stepvalue
- poly: polynomial decay
- sigmoid: sigmoid 衰減