Caffe的solver引數介紹

阿新 • • 發佈：2018-11-03

轉自：http://noahsnail.com/2017/02/23/2017-2-23-Caffe%E7%9A%84solver%E5%8F%82%E6%95%B0%E4%BB%8B%E7%BB%8D/

1. Parameters

solver.prototxt檔案是用來告訴caffe如何訓練網路的。solver.prototxt的各個引數的解釋如下：

base_lr
這個引數是用來表示網路的初始學習率的。這個值是一個浮點型實數。
lr_policy
這個引數是用來表示學習率隨著時間是如何變化的。值是字串，需要加""。學習率變化的可選引數有：
“step”——需要設定stepsize。根據gamma

引數和stepsize引數來降低學習率，base_lr * gamma ^ (floor(iter / stepsize))。iter是當前迭代次數。學習率每迭代stepsize次變化一次。
“multistep”——與step類似，需要設定stepvalue，學習率根據stepvalue進行變化。
“fixed”——學習率base_lr保持不變。
“inv”——學習率變化公式為base_lr * (1 + gamma * iter) ^ (- power)
“exp”——學習率變化公式為base_lr * gamma ^ iter}
“poly”——學習率以多項式形式衰減，到最大迭代次數時降為0。學習率變化公式為base_lr * (1 - iter/max_iter) ^ (power)

。
“sigmoid”——學習率以S型曲線形式衰減，學習率變化公式為base_lr * (1 / (1 + exp(-gamma * (iter - stepsize))))。
gamma
這個引數表示學習率每次的變化程度，值為實數。
stepsize
這個引數表示什麼時候應該進行訓練的下一過程，值為正整數。主要用在lr_policy為step的情況。
stepvalue
這個引數表示什麼時候應該進行訓練的下一過程，值為正整數。主要用在lr_policy為multistep的情況。
max_iter
這個引數表示訓練神經網路迭代的最大次數，值為正整數。
momentum
這個引數表示在新的計算中要保留的前面的權重數量，值為真分數，通常設為0.9。

weight_decay
這個引數表示對較大權重的懲罰（正則化）因子。值為真分數。
This parameter indicates the factor of (regularization) penalization of large weights. This value is a often a real fraction.
solver_mode
這個引數用來表示求解神經網路的模式——值為CPU or GPU。
snapshot
這個引數用來表示每迭代多少次就應該儲存snapshot的model和solverstate，值為正整數。
snapshot_prefix:
這個引數用來表示儲存snapshot時model和solverstate的字首，值為帶引號的字串。
net:
這個引數表示訓練網路所在的位置，值為帶引號的字串。
test_iter
這個引數表示
這個引數表示每個test_interval進行多少次test迭代，值為正整數。
test_interval
這個引數表示什麼時候進行資料的測試，值為正整數。
display
這個引數用來表示什麼時候將輸出結果列印到螢幕上，值為正整數，表示迭代次數。
type
這個引數表示訓練神經網路採用的反向傳播演算法，值為帶引號的字串。可選的值有：
Stochastic Gradient Descent “SGD”——隨機梯度下降，預設值。
AdaDelta “AdaDelta”——一種”魯棒的學習率方法“，是基於梯度的優化方法。
Adaptive Gradient “AdaGrad”——自適應梯度方法。
Adam “Adam”——一種基於梯度的優化方法。
Nesterov’s Accelerated Gradient “Nesterov”——Nesterov的加速梯度法，作為凸優化中最理想的方法，其收斂速度非常快。
RMSprop “RMSProp”——一種基於梯度的優化方法。

2. Demo

lr_policy

# lr_policy為multisetp
base_lr: 0.01
momentum: 0.9
lr_policy: "multistep"
gamma: 0.9
stepvalue: 1000
stepvalue: 2000
stepvalue: 3000
stepvalue: 4000
stepvalue: 5000
# lr_policy為step
base_lr: 0.01
momentum: 0.9
lr_policy: "step"
gamma: 0.9
stepsize: 1000

solver.prototxt

net: "models/bvlc_alexnet/train_val.prototxt"
# 每次測試時進行1000次迭代
test_iter: 1000
# 每進行1000次訓練執行一次測試
test_interval: 1000
base_lr: 0.01
lr_policy: "step"
gamma: 0.1
stepsize: 100000
display: 20
max_iter: 450000
momentum: 0.9
weight_decay: 0.0005
snapshot: 10000
snapshot_prefix: "models/bvlc_alexnet/caffe_alexnet_train"
solver_mode: GPU

參考資料

JVM -XX: 引數介紹

JVM -XX: 引數介紹功能開關: 引數預設值或限制說明引數預設值功能 -XX:-AllowUserSi

MongoDB 4.0 備份恢復工具引數介紹

# ./mongo --version MongoDB shell version v4.0.2 git version: fc1573ba18aee42f97a3bb13b67af7d837826b47 OpenSSL version: OpenSSL 1.0.1e-fips 11 Feb 2

python DRF獲取引數介紹

DRF獲取引數的方式例如url url(r'^demo/(?P<word>.*)/$', DemoView.as_view()) 在類檢視中獲取引數 url:http://127.0.0.1:8000/demo/aaa/?bbb=bbb&ccc=ccc&ccc=

Caffe的solver引數介紹

轉自：http://noahsnail.com/2017/02/23/2017-2-23-Caffe%E7%9A%84solver%E5%8F%82%E6%95%B0%E4%BB%8B%E7%BB%8D/ 1. Parameters solver.prototxt檔案是用來告訴caffe如何

sqoop import export引數介紹

通用引數選項含義說明 –connect 指定JDBC連線字串 –connection-manager 指定要使用的連線管理器類

MT7658晶片組資料,MT7658處理器引數介紹

MT7658C是高度整合的單片晶片，具有低功耗的1x11a/b/g/n/ac雙波段Wi-Fi子系統和藍芽子系統。Wi-Fi子系統包含802.11a/b/g/n/ac無線電、基帶。用於滿足低功耗和高吞吐量應用程式的seband和MAC。MT7658c有一個32位的RISC MCU，它可以處理Wi-Fi

NVP2450H基本引數介紹

FHD CMOS AHD™ Camera ISP Max resolution : [email protected] NVP2450H is the 2nd gen AHD™ ISP line-up which realizes super-clear imaging up to

Linux系統IO分析工具之iotop常用引數介紹

　　　　　　　　　　　　　　　　　　　　Linux系統IO分析工具之iotop常用引數介紹　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　作者：尹正傑版權宣告：原創作品，謝絕轉載！否則將追究法律責任。　　W

Linux系統IO分析工具之iotstat常用引數介紹

　　　　　　　　　　　　　　　　Linux系統IO分析工具之iotstat常用引數介紹　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　作者：尹正傑版權宣告：原創作品，謝絕轉載！否則將追究法律責任。 1>.安裝

ORM基礎之欄位及其引數介紹

一、外來鍵ForeignKey 1、欄位引數 1.to 設定要關聯的表 2.to_field 設定要關聯的表的欄位(一般不設定，預設使用主鍵id關聯) 3.related_name 反向操作時，使用的欄位名，用

layer：彈出層引數介紹

例子： layer.open({ type: 2, title: '彈出層標

mysql innodb常用引數介紹

檢視預設的儲存引擎是那種 show variables like 'default_storage_engine'; 在 my.cnf加入,重啟生效 default_storage_engine=innodb 設定預設儲存引擎 innodb初期重要引數設定 show vari

[C/C++] 格式化字串引數介紹

格式化輸出標準格式 % [flag] [fldwidth] [precision] [lenmodifier] convtype 格式化輸入標準格式 % [*] [fldwidth] [m] [lenmodifier] convtype *用於抑制轉換，按照轉換說明的其餘部分對輸入進行轉

jQuery ajax模板及各引數介紹

Ajax簡介： Ajax 即“Asynchronous Javascript And XML”（非同步 JavaScript 和 XML），是指一種建立互動式網頁應用的網頁開發技術。 Ajax = 非同步 javaScript 和 XML（標準通用標記語言的

Istio技術與實踐06：史上最全！Istio安裝引數介紹

一、 CertManage Istio-1.0版本新加入的元件，利用ACME為Istio簽發證書 Key Default Value Description certmanager.enabled TRUE

echarts生成餅狀圖、柱狀圖、多項柱狀圖的引數介紹

1.餅圖 html程式碼： <div id="SexDistri" style="width: 100%;height: 50%;"></div> 下面的柱狀圖的html程式碼也與此類似。 js程式碼： var SexDistributi

Django -- url中的引數介紹

參考文件直達 url()函式傳遞四個引數，兩個必選引數：regex和view，兩個可選引數：kwargs和name。在這裡，值得重新審視這些引數。 url()引數：regex 術語“regex”是一種常用的縮寫，意思是“正則表示式”，它是用於匹配字串中的模式的語法，換言之，在

useradd常用引數介紹

-c　　:新賬號passwd檔的說明欄 -d　　:新賬號每次登入時所使用的home_dir，預設值為default_home內login名稱，並當成登入時目錄名稱 -e　　:*賬號終止日期，日期的指定格式為MM/DD/YY -g　　:*group(組)名稱或以數字來做使用者登入的起始組。 -G　　

java-xx引數介紹及調優總結

功能開關: 引數預設值或限制說明引數預設值功能 -XX:-AllowUserSignalHandlers 限於Linux和Solaris，預設不啟用

聯發科四核處理器MT6589詳細晶片引數介紹

MT6589是聯發科釋出的旗下四核移動處理器，該處理器基於臺積電28nm製造工藝，採用ARM Cortex-A7 CPU架構，效能方面的表現是較為不錯的。該處理器採用Imagination PowerVR Series 5XT圖形核心。MTK6589可以支援1080p 30fps低功耗視訊錄製與播放

Caffe的solver引數介紹

1. Parameters

相關推薦