1. 程式人生 > >caffe 超引數設定

caffe 超引數設定

文章目錄

寫在前面

caffe的超引數文字是caffe非常重要的一個檔案,它是caffe訓練網路的一個入口

solver.prototxt

test_iter: 580
test_interval: 4420
base_lr: 0.001
display: 278
max_iter: 88400
lr_policy: "poly"
power: 1.0
momentum: 0.9
weight_decay: 1e-05
snapshot: 8840
snapshot_prefix: "snapshot"
solver_mode: GPU
net: "train_val.prototxt"
solver_type: NESTEROV

引數含義的描述:
test_iter 測試的批次數 test_iter*batch_size = test-data 總測試樣本資料。 例如mnist資料集中訓練資料50000,測試資料10000,所以我們可以設定batch_size為100,則需要迭代100次才能將10000個數據全部執行完,因此,將test_iter設定為100。執行完一次全部資料,稱之為一個epoch。
test_interval 測試間隔,每訓練多少次進行一次測試
base_lr 學習率設定
lr_policy 設定策略調整

  • fixed:   保持base_lr不變
  • step:    階梯衰減 base_lr * gamma ^ (floor(iter / step)) 【需要gamma 和 step】
  • exp   指數衰減 base_lr * gamma ^ iter 【需要gamma】
  • inv   倒數衰減 base_lr * (1 + gamma * iter) ^ (- power) 【需要gamma 和 power】
  • multistep   similar to step but it allows non uniform steps defined by stepvalue
  • poly:    polynomial decay
  • sigmoid:    sigmoid 衰減

在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述