Caffe配置：引數的介紹入門

阿新 • • 發佈：2019-01-22

利用Caffe進行深度神經網路訓練第一步需要搞懂幾個重要檔案：

solver.prototxt
train_val.prototxt
train.sh

接下來我們按順序一個個說明。

solver.prototxt

solver這個檔案主要存放模型訓練所用到的一些超引數：

net := 指定待訓練模型結構檔案，即train_val.prototxt
test_interval := 測試間隔，即每隔多少次迭代進行一次測試
test_initialization := 指定是否進行初始測試，即模型未進行訓練時的測試
test_iteration := 指定測試時進行的迭代次數
base_lr := 指定基本學習率

lr_policy := 學習率變更策略，這裡有介紹，可供參考
gamma := 學習率變更策略需要用到的引數
power := 同上
stepsize := 學習率變更策略Step的變更步長（固定步長）
stepvalue := 學習率變更策略Multistep的變更步長（可變步長）
max_iter := 模型訓練的最大迭代次數
momentum := 動量，這是優化策略（Adam, SGD, … ）用到的引數
momentum2 := 優化策略Adam用到的引數
weight_decay := 權重衰減率
clip_gradients := 固定梯度範圍
display := 每隔幾次迭代顯示一次結果
snapshot

:= 快照，每隔幾次儲存一次模型引數
snapshot_prefix := 儲存模型檔案的字首，可以是路徑
type := solver優化策略，即SGD、Adam、AdaGRAD、RMSProp、NESTROVE、ADADELTA等
solver_mode := 指定訓練模式，即GPU/CPU
debug_info := 指定是否列印除錯資訊，這裡有對啟用該功能的輸出作介紹
device_id := 指定裝置號（使用GPU模式），預設為0

使用者根據自己的情況進行相應設定，黑體引數為必須指定的，其餘引數為可選（根據情況選擇）。

train_val.prototxt

train_val檔案是用來存放模型結構的地方，模型的結構主要以layer為單位來構建。下面我們以LeNet為例介紹網路層的基本組成：

name: "LeNet"
layer {
  name: "mnist"                                #網路層名稱
  type: "Data"                                 #網路層型別，資料層
  top: "data"                                  #這一層的輸出，資料
  top: "label"                                 #這一層的輸出，標籤
  include {    phase: TRAIN  }                 #TRAIN:=用於訓練,TEST:=用於測試
  transform_param {    scale: 0.00390625  }    #對資料進行scale
  data_param {                                 #資料層配置 
    source: "examples/mnist/mnist_train_lmdb"  #資料存放路徑
    batch_size: 64                             #指定batch大小
    backend: LMDB                              #指定資料庫格式，LMDB/LevelDB
  }
}
layer {
  name: "mnist"
  type: "Data"
  top: "data"
  top: "label"
  include {    phase: TEST  }
  transform_param {    scale: 0.00390625  }
  data_param {
    source: "examples/mnist/mnist_test_lmdb"
    batch_size: 100
    backend: LMDB
  }
}
layer{
    name:"conv1"       
    type:"Convolution" #卷積層
    bottom:"data"      #上一層的輸出作為輸入
    top:"conv1"        
    param{name:"conv1_w" lr_mult:1 decay_mult:1} #卷積層引數w的名稱，學習率和衰減率（相對於base_lr和weight_decay的倍數）
    param{name:"conv1_b" lr_mult:2 decay_mult:0} #卷積層引數b的名稱，學習率和衰減率
    convolution_param{
        num_output:20         #卷積層輸出的feature map數量 
        kernel_size:5         #卷積層的大小
        pad:0                 #卷積層的填充大小
        stride:1              #進行卷積的步長
        weight_filler{type:"xavier" }      #引數w的初始話策略
        weight_filler{type:"constant" value:0.1}     #引數b的初始化策略
    }
}
layer {　　　　　　　　＃BatchNorm層，對feature map進行批規範化處理
    name:"bn1"
    type:"BatchNorm"
    bottom:"conv1"
    top:"conv1"
    batch_norm_param{ use_global_stats:false} #訓練時為false，測試時為true
}
layer {           #池化層，即下采樣層
  name: "pool1"
  type: "Pooling"
  bottom: "conv1"
  top: "pool1"
  pooling_param {
    pool: MAX   #最大值池化，還有AVE均值池化
    kernel_size: 2
    stride: 2
  }
}
layer {
  name: "conv2"
  type: "Convolution"
  bottom: "pool1"
  top: "conv2"
  param {    lr_mult: 1  }
  param {    lr_mult: 2  }
  convolution_param {
    num_output: 50
    kernel_size: 5
    stride: 1
    weight_filler {      type: "xavier"    }
    bias_filler {      type: "constant"    }
  }
}
layer {
    name:"bn2"
    type:"BatchNorm"
    bottom:"conv2"
    top:"conv2"
    batch_norm_param{ use_global_stats:false}
}
layer {
  name: "pool2"
  type: "Pooling"
  bottom: "conv2"
  top: "pool2"
  pooling_param {
    pool: MAX
    kernel_size: 2
    stride: 2
  }
}
layer {           　　　           ＃全連線層
  name: "ip1"
  type: "InnerProduct"
  bottom: "pool2"
  top: "ip1"
  param {    lr_mult: 1  }  
  param {    lr_mult: 2  }
  inner_product_param {
    num_output: 500
    weight_filler {      type: "xavier"    }
    bias_filler {      type: "constant"    }
  }
}
layer {                             #啟用函式層，提供非線效能力
  name: "relu1"
  type: "ReLU"
  bottom: "ip1"
  top: "ip1"
}
layer {
  name: "ip2"
  type: "InnerProduct"
  bottom: "ip1"
  top: "ip2"
  param {    lr_mult: 1  }
  param {    lr_mult: 2  }
  inner_product_param {
    num_output: 10
    weight_filler {      type: "xavier"    }
    bias_filler {      type: "constant"    }
  }
}
layer {                             #損失函式層
  name: "prob"
  type: "SoftmaxWithLoss"
  bottom: "ip2"
  bottom: "label"
  top: "prob"
}

引數初始化策略可參考這裡，啟用函式可參考這裡。

網路結構和超引數都設計完了，接下來就可以進行模型訓練了。這裡我介紹最常用的模型訓練指令碼，也是Caffe官方文件給的例子。

train.sh

這個指令碼檔案可寫，可不寫。每次執行需要寫一樣的命令，所以建議寫一下。

TOOLS=/path/to/your/caffe/build/tools
GLOG_logtostderr=0 GLOG_log_dir=log/ \ #該行用於呼叫glog進行訓練日誌儲存，使用時請把該行註釋刪除，否則會出錯
$TOOLS/caffe train --solver=/path/to/your/solver.prototxt #--snapshot=/path/to/your/snapshot or --weights=/path/to/your/caffemodel ,snapshot和weights兩者只是選一，兩個引數都可以用來繼續訓練，區別在於是否儲存solver狀態

資料準備

這裡我們舉個簡單的例子，改程式碼是Caffe官方文件提供的，但只能用於單標籤的任務，多標籤得對原始碼進行修改。該指令碼是對圖片資料生成對應的lmdb檔案，博主一般使用原圖，即資料層型別用ImageData。

#!/usr/bin/env sh
# Create the imagenet lmdb inputs
# N.B. set the path to the imagenet train + val data dirs
set -e

EXAMPLE=""                            #儲存路徑
DATA=""                               #資料路徑
TOOLS=/path/to/your/caffe/build/tools #caffe所在目錄

TRAIN_DATA_ROOT=""                   #訓練資料根目錄
VAL_DATA_ROOT=""                     #測試資料根目錄
# RESIZE=true to resize the images to 256x256. Leave as false if images have
# already been resized using another tool.
RESIZE=false                         #重新調整圖片大小
if $RESIZE; then
  RESIZE_HEIGHT=256
  RESIZE_WIDTH=256
else
  RESIZE_HEIGHT=0
  RESIZE_WIDTH=0
fi

#檢測路徑是否存在
if [ ! -d "$TRAIN_DATA_ROOT" ]; then
  echo "Error: TRAIN_DATA_ROOT is not a path to a directory: $TRAIN_DATA_ROOT"
  echo "Set the TRAIN_DATA_ROOT variable in create_imagenet.sh to the path" \
       "where the ImageNet training data is stored."
  exit 1
fi

if [ ! -d "$VAL_DATA_ROOT" ]; then
  echo "Error: VAL_DATA_ROOT is not a path to a directory: $VAL_DATA_ROOT"
  echo "Set the VAL_DATA_ROOT variable in create_imagenet.sh to the path" \
       "where the ImageNet validation data is stored."
  exit 1
fi

echo "Creating train lmdb..."

GLOG_logtostderr=1 $TOOLS/convert_imageset \
    --resize_height=$RESIZE_HEIGHT \
    --resize_width=$RESIZE_WIDTH \
    --shuffle \
    $TRAIN_DATA_ROOT \
    $DATA/train.txt \                #訓練圖片列表，執行時請把該行註釋刪除，否則會出錯
    $EXAMPLE/mnist_train_lmdb

echo "Creating val lmdb..."

GLOG_logtostderr=1 $TOOLS/convert_imageset \
    --resize_height=$RESIZE_HEIGHT \
    --resize_width=$RESIZE_WIDTH \
    --shuffle \
    $VAL_DATA_ROOT \
    $DATA/val.txt \
    $EXAMPLE/mnist_test_lmdb

echo "Done."

Caffe配置：引數的介紹入門

利用Caffe進行深度神經網路訓練第一步需要搞懂幾個重要檔案： solver.prototxttrain_val.prototxttrain.sh 接下來我們按順序一個個說明。 solver.prototxt solver這個檔案主要存放模型訓練所用到的一些超引數：

MySQL主從配置：主從介紹、配置主和從、測試主從同步

mysql主從配置 MySQL主從介紹（兩臺機器數據同步）主：-->binlog從：-->relaylog主上有一個log dump線程，用來和從的I/O線程傳遞binlog 從上有兩個線程，其中I/O線程用來同步主的binlog並生成relaylog，另外一個SQL線程用來

SpringBoot配置：yaml介紹

xiaohua 就會 map imp ole dog per 表示 span 一、介紹yml　　 1、Spring Boot使用一個全局的配置文件(配置文件的名字是固定的) 　　（1）application.properties 　　（2）application.yml 2

Caffe的solver引數介紹

轉自：http://noahsnail.com/2017/02/23/2017-2-23-Caffe%E7%9A%84solver%E5%8F%82%E6%95%B0%E4%BB%8B%E7%BB%8D/ 1. Parameters solver.prototxt檔案是用來告訴caffe如何

spring boot 專案重新搭建----------mvc配置：引數解析

7.addResourceHandlers靜態資源解析如： registry.addResourceHandler("/webjars/**").addResourceLocations("classpath:/META-INF/resources/webjars/"); 8.addC

Caffe常用層引數介紹

DATA crop:擷取原影象中一個固定patch layers { name: "data" type: DATA top: "data" top: "label" data_param

redis配置檔案引數介紹

? 1 redis-server.exe redis.conf client連線: cmd到指定目錄 ? 1 redis-cli.exe -h 127.0.0.1 -p 6379 redis.conf配置檔案

大數據入門基礎：SSH介紹

大數據什麽是ssh簡單說，SSH是一種網絡協議，用於計算機之間的加密登錄。如果一個用戶從本地計算機，使用SSH協議登錄另一臺遠程計算機，我們就可以認為，這種登錄是安全的，即使被中途截獲，密碼也不會泄露。最早的時候，互聯網通信都是明文通信，一旦被截獲，內容就暴露無疑。1995年，芬蘭學者Tatu Ylonen設

webpackt入門1：webpack介紹&webpack安裝&使用webpack打包

github 輸出 rip 除了原創 ini com lec 轉換成本篇博客不是原創，簡書的zhangwang寫的，原文太長，我這裏只是提取了一部分。原文地址：入門webpack，看這篇就夠了一、Webpack解決了什麽問題問題

《01.Spring Boot連載：Spring Boot入門介紹》

spring boot maven 1 Spring Boot的概述Spring Boot是開發者和Spring 本身框架的中間層，幫助開發者統籌管理應用的配置，提供基於實際開發中常見配置的默認處理（即習慣優於配置），簡化應用的開發，簡化應用的運維；總的來說，其目的Spring Boot就是為了對Ja

webpack快速入門——插件配置：HTML文件的發布

文件 mlp image cnblogs logs 快速入門 npm webpack blog 1.把dist中的index.html復制到src目錄中，並去掉我們引入的js 2.在webpack.config.js中引入 const htmlPlugin = requi

第一篇：Tomcat介紹、安裝、配置

分享圖片訪問網站 esp ext .tar.gz resp less a20 關閉防火墻一、Tomcat介紹 Tomcat是Apache軟件基金會（Apache Software Foundation）的Jakarta項目中的一個核心項目，有Apache 、Sun和其

進階版Venn plot：Upset plot入門實戰程式碼詳解——UpSetR包介紹

網上已有一些帖子講解了Upset plot的背景知識和實現方法，本文旨在從實戰角度出發，解讀Upset plot實現的一些途徑及其優劣勢以及如何通過upsetR包實現Upset plot的繪製，並提供程式碼和input格式示例。另博主在使用

layer：彈出層引數介紹

例子： layer.open({ type: 2, title: '彈出層標

SpringCloud微服務基礎6：引數配置

1、Eureka引數配置說明（1）eureka.client.service-url.defaultZone 這裡是我們配置的微服務名稱。（2）eureka.client.fetch-registry 設定是否從註冊中心獲取註冊資訊（預設tr

Istio技術與實踐06：史上最全！Istio安裝引數介紹

一、 CertManage Istio-1.0版本新加入的元件，利用ACME為Istio簽發證書 Key Default Value Description certmanager.enabled TRUE

Beego框架：引數配置

beego 目前支援 INI、XML、JSON、YAML 格式的配置檔案解析，但是預設採用了 INI 格式解析，使用者可以通過簡單的配置就可以獲得很大的靈活性。 #預設配置解析 beego 預設會解析當前應用下的 conf/app.conf 檔案。通過這個檔案你可以初始化很多

Elam的caffe筆記之配置篇：基於CentOS6.5 python3.6 CUDA8.0 cudnnv5.1 opencv3.1 下的caffe配置

Elam的caffe筆記之配置篇：基於CentOS6.5 python3.6 CUDA8.0 cudnnv5.1 opencv3.1 下的caffe配置作為一個完完全全的linux小白，平時連cmd開啟資料夾都要百度的人，面對單獨配置caffe這個棘手任務，第一反應就是搜教程。

8.霍夫變換：線條——介紹、引數模型、直線擬合_1

目錄介紹引數模型直線擬合介紹到目前為止，我們一直在做影象處理，你把一個影象和應用一些函式相加得到一個新的影象我標記為。這很好，整個課程，實際上是整個職業生涯，數以萬計的PHD寫在影象處理上。但這不是我們來這裡的原因。我們來談談真正的計

JS：Basic JavaScript入門（一）--引數

Comment your JavaScript Code 註釋的程式碼塊在JavaScript之中是不會執行的。註釋是一個非常好的方式讓你自己以及其他人明白這段程式碼是怎麼執行的。 JavaScript中的註釋方式有以下兩種：使用 // 來告訴JavaScript來忽略當前行的程

Caffe配置：引數的介紹入門

solver.prototxt

train_val.prototxt

train.sh

資料準備

相關推薦