從零開始學caffe（四）：mnist手寫數字識別網路結構模型和超引數檔案的原始碼閱讀

阿新 • • 發佈：2018-12-26

下面為網路結構模型

%網路結構模型
name: "LeNet"               #網路的名字"LeNet"
layer {                     #定義一個層
  name: "mnist"             #層的名字"mnist"
  type: "Data"              #層的型別"Data"，表明資料來源於LevelDB或LMDB。另外資料的來源還可能是來自記憶體，HDF5，圖片等
  top: "data"               #top表示輸出，在這裡輸出data
  top: "label"              #這一層共有兩個輸出，這裡輸出label 

  include {
    phase: TRAIN            #該層只在TRAIN訓練的時候有效
  }
  transform_param {         #資料的預處理
    scale: 0.00390625       #即1/256，將輸入的資料0-255歸一化到0-1之間
  }
  data_param {
    source: "E:/Caffe-windows/caffe-windows/examples/mnist/lmdb/train_lmdb" #資料來源
    batch_size: 64          #每個批次處理64張圖片
    backend: LMDB           #資料格式LMDB 

  }
}
layer {                     #定義一個層
  name: "mnist"             #層的名字"mnist"
  type: "Data"              #層的型別"Data"，表明資料來源於LevelDB或LMDB
  top: "data"               #輸出dada
  top: "label"              #輸出label
  include {                 
    phase: TEST             #該層只在TEST測試的時候有效
  }                         
  transform_param { 
         #資料的預處理
    scale: 0.00390625       #1/256，將輸入的資料0-255歸一化到0-1之間
  }
  data_param {
    source: "E:/Caffe-windows/caffe-windows/examples/mnist/lmdb/test_lmdb" #資料來源
    batch_size: 100         #每個批次處理100張圖片
    backend: LMDB           #資料格式LMDB
  }
}
layer {                     #定義一個層
  name: "conv1"             #層的名字"conv1"
  type: "Convolution"       #層的型別"Convolution"
  bottom: "data"            #輸入data
  top: "conv1"              #輸出conv1
  param {                   #這個是權值的學習率
    lr_mult: 1              #學習率係數。最終的學習率是這個學習率係數lr_mult乘以solver.prototxt超引數檔案裡面的base_lr（基本學習率）
  }
  param {                   #這個是偏置的學習率
    lr_mult: 2              #學習率係數。最終的學習率是這個學習率係數lr_mult乘以solver.prototxt裡面的base_lr
  }
  convolution_param {
    num_output: 20          #卷積核的個數為20，或者表示輸出特徵平面的個數為20
    kernel_size: 5          #卷積核的大小5*5。如果卷積核長和寬不等，則需要用kernel_h和kernel_w分別設定
    stride: 1               #步長為1。也可以用stride_h和stride_w來設定
    weight_filler {         #權值初始化
      type: "xavier"        #使用"Xavier"演算法，也可以設定為"gaussian"
    }
    bias_filler {           #偏置初始化
      type: "constant"      #一般設定為"constant",取值為0
    }
  }
}
layer {                     #定義一個層
  name: "pool1"             #層的名字"pool1"
  type: "Pooling"           #層的型別"Pooling"
  bottom: "conv1"           #輸入conv1
  top: "pool1"              #輸出pool1
  pooling_param {           
    pool: MAX               #池化方法。常用的方法有MAX,AVE或STOCHASTIC
    kernel_size: 2          #池化核的大小2*2。如果池化核長和寬不等，則需要用kernel_h和kernel_w分別設定
    stride: 2               #池化的步長。也可以用stride_h和stride_w來設定
  }
}
layer {
  name: "conv2"
  type: "Convolution"
  bottom: "pool1"
  top: "conv2"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  convolution_param {
    num_output: 50          #卷積核的個數為50，或者表示輸出特徵平面的個數為50
    kernel_size: 5
    stride: 1
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
}
layer {
  name: "pool2"
  type: "Pooling"
  bottom: "conv2"
  top: "pool2"
  pooling_param {
    pool: MAX
    kernel_size: 2
    stride: 2
  }
}
layer {                     #定義一個層
  name: "ip1"               #層的名字"ip1"
  type: "InnerProduct"      #層的型別"InnerProduct"，全連線層
  bottom: "pool2"           #輸入pool2
  top: "ip1"                #輸出ip1
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  inner_product_param {
    num_output: 500         #500個神經元
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
}
layer {                     #定義一個層
  name: "relu1"             #層的名字"relu1"
  type: "ReLU"              #層的型別"ReLU"，啟用函式，可以防止梯度消失和梯度爆炸
  bottom: "ip1"             #輸入ip1
  top: "ip1"                #輸出ip1
}
layer {                     #定義一個層
  name: "ip2"               #層的名字"ip2"
  type: "InnerProduct"      #層的型別"InnerProduct"，全連線層
  bottom: "ip1"             #輸入ip1
  top: "ip2"                #輸出ip2
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  inner_product_param {
    num_output: 10          #10個輸出，代表10個分類
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
}
layer {                     #定義一個層
  name: "accuracy"          #層的名字"accuracy"
  type: "Accuracy"          #層的型別"Accuracy"，用來判斷準確率
  bottom: "ip2"             #層的輸入ip2
  bottom: "label"           #層的輸入label
  top: "accuracy"           #層的輸出accuracy
  include {
    phase: TEST             #該層只在TEST測試的時候有效
  }
}
layer {                     #定義一個層
  name: "loss"              #層的名字"loss"
  type: "SoftmaxWithLoss"   #層的型別"SoftmaxWithLoss"，輸出loss值
  bottom: "ip2"             #層的輸入ip2
  bottom: "label"           #層的輸入label
  top: "loss"               #層的輸出loss
}

下面為超引數檔案的程式碼

#網路模型描述檔案
#也可以用train_net和test_net來對訓練模型和測試模型分別設定
#train_net: "xxxxxxxxxx"
#test_net: "xxxxxxxxxx"
net: "E:/Caffe-windows/caffe-windows/examples/mnist/lenet_train_test.prototxt"傳入模型檔案
#這個引數要跟test_layer結合起來考慮，在test_layer中一個batch是100，而總共的測試圖片是10000張
#所以這個引數就是10000/100=100
test_iter: 100
#每訓練500次進行一次測試
test_interval: 500
#基本學習率，最終學習率還需要乘以一個引數
base_lr: 0.01
#動力
momentum: 0.9
#type:SGD #優化演算法的選擇。這一行可以省略，因為預設值就是SGD，Caffe中一共有6中優化演算法可以選擇
#Stochastic Gradient Descent (type: "SGD"), 在Caffe中SGD其實應該是Momentum
#AdaDelta (type: "AdaDelta"),
#Adaptive Gradient (type: "AdaGrad"),
#Adam (type: "Adam"),
#Nesterov’s Accelerated Gradient (type: "Nesterov")
#RMSprop (type: "RMSProp")
#權重衰減項，其實也就是正則化項。作用是防止過擬合
weight_decay: 0.0005
#學習率調整策略
#如果設定為inv,還需要設定一個power, 返回base_lr * (1 + gamma * iter) ^ (- power)，其中iter表示當前的迭代次數
lr_policy: "inv"
gamma: 0.0001
power: 0.75
#每訓練100次螢幕上顯示一次，如果設定為0則不顯示
display: 100
#最大迭代次數
max_iter: 2000
#快照。可以把訓練的model和solver的狀態進行儲存。每迭代5000次儲存一次，如果設定為0則不儲存
snapshot: 5000
snapshot_prefix: "E:/Caffe-windows/caffe-windows/examples/mnist/models"
#選擇執行模式，這裡以CPU進行模型的執行
solver_mode: CPU

從零開始學caffe（四）：mnist手寫數字識別網路結構模型和超引數檔案的原始碼閱讀

下面為網路結構模型 %網路結構模型 name: "LeNet" #網路的名字"LeNet" layer { #定義一個層 name: "mnist" #層的名字"mnist" type:

從零開始學caffe（七）：利用GoogleNet實現影象識別

一、準備模型在這裡，我們利用已經訓練好的Googlenet進行物體影象的識別，進入Googlenet的GitHub地址，進入models資料夾，選擇Googlenet 點選Googlenet的模型下載地址下載該模型到電腦中。模型結構在這裡，我們利用之前講

從零開始學caffe（十）：caffe中snashop的使用

在caffe的訓練期間，我們有時候會遇到一些不可控的以外導致訓練停止（如停電、裝置故障燈），我們就不得不重新開始訓練，這對於一些大型專案而言是非常致命的。在這裡，我們介紹一些caffe中的snashop。利用snashop我們就可以實現訓練的繼續進行。在之前我們訓練得到的檔案中，我們發現

從零開始學caffe（九）：在Windows下實現影象識別

本系列文章主要介紹了在win10系統下caffe的安裝編譯，運用CPU和GPU完成簡單的小專案，文章之間具有一定延續性。 step1:準備資料集資料集是進行深度學習的第一步，在這裡我們從以下五個連結中下載所需要的資料集： animal flower plane hou

從零開始學caffe（八）：Caffe在Windows環境下GPU版本的安裝

之前我們已經安裝過caffe的CPU版本，但是在MNIST手寫數字識別中，我們發現caffe的CPU版本執行速度較慢，訓練效率不高。因此，在這裡我們安裝了caffe的GPU版本，並使用GPU版本的caffe同樣對手寫MNIST數字集進行訓練。 step1: 安裝CUDA

從零開始學caffe（二）：caffe在win10下的安裝編譯

環境要求作業系統：64位windows10 編譯環境：Visual Studio 2013 Ultimate版本安裝流程 step1：檔案的下載從GitHub新增連結描述中下載Windows版本的caffe，並進行解壓到電腦中。 step2:檔案修改將壓縮包

從零開始學演算法（四）歸併排序

從零開始學演算法（四）歸併排序歸併排序演算法介紹演算法原理演算法簡單記憶說明演算法複雜度和穩定性程式碼實現歸併排序程式碼是Javascript語言寫的（幾乎是虛擬碼）演算

Keras入門實戰（1）：MNIST手寫數字分類

前面的部落格中已經介紹瞭如何在Ubuntu下安裝Keras深度學習框架。現在我們使用 Keras 庫來學習手寫數字分類。我們這裡要解決的問題是：將手寫數字的灰度影象（28 畫素×28 畫素）劃分到 10 個類別中（0~9）。我們將使用 MNIST 資料集，它是機器學

Caffe學習筆記(六)：mnist手寫數字識別訓練例項

一、前言深度學習的一個簡單例項就是mnist手寫數字識別，只要這個例子弄明白，其它的內容就可以舉一反三了。之前的內容如有遺忘，可以進行回顧。二、準備資料資料集可以直接從我的github下載，包括資料集和程式碼，使用如下指令：

從零開始學USB（四、USB系統結構）

一個USB系統可以從三個定義區域來描述： USB互聯 USB裝置 USB主機 USB互連是USB裝置與USB主機連線和通訊的方式。這包括以下內容：匯流排拓撲：USB裝置與主機之間的連線模型。層間關係：USB在系統中的每一層都要完成一定的任務。資料流模型：

從零開始學HTTP （二） HTTP結構與基礎

現象 encode 伸縮協議 for 服務端例如 lis 格式 HTTP結構與基礎這篇文章中，我們主要針對HTTP\1.1版本進行介紹請求報文和響應報文請求報文請求報文由客戶端發出，其格式為：請求方法請求URI 協議版本可選的請求首部字段和內容實體，

從PRISM開始學WPF（四）Prism-Module？

程序 turn 開發 .config nta 部署 true reat odin 原文:從PRISM開始學WPF（四）Prism-Module？從PRISM開始學WPF（一）WPF？從PRISM開始學WPF（二）Prism？從PRISM開始學WPF（三）Prism-

從零開始學演算法（三）插入排序

從零開始學演算法（三）插入排序插入排序演算法介紹演算法原理演算法簡單記憶說明演算法複雜度和穩定性程式碼實現插入排序程式碼是Javascript語言寫的（幾乎是虛擬碼）演算

從零開始學演算法（二）選擇排序

從零開始學演算法（二）選擇排序選擇排序演算法介紹演算法原理演算法簡單記憶說明演算法複雜度和穩定性程式碼實現選擇排序程式碼是Javascript語言寫的（幾乎是虛擬碼）演算

從零開始學演算法（一）氣泡排序

從零開始學演算法（一）氣泡排序氣泡排序演算法介紹演算法原理演算法簡單記憶說明演算法複雜度和穩定性程式碼實現氣泡排序因為在學前端，程式碼是Javascript語言寫的演算法

從零開始學WCF（14）WCF安全性概述

安全性概述常見的安全威脅： 1）觀測網路流量以獲取敏感資訊。以線上銀行為列，某個客戶端請求將資金從一個賬戶轉賬到另一個賬戶。一個惡意使用者截獲了此訊息（具有賬號和密碼），隨後從盜用的賬戶將資金轉出。 2）欺詐性實體在客戶端未發覺的情況下其服務的作用。在此情況下，惡意使

從零開始學mysql（一）

自從用雲筆記，已經很少來了 ·· 以前接觸過mysql，但最多的時候還是使用Oracle，現在正好剛剛離職，有時間來學習一下，對於以前接觸過的mysql，只是簡單的查查而已。先看官網文件吧，一點點來吧，不怕走錯路，就怕一步不走。版本：MySQL 5.7

從零開始學django（一）

一、web應用、http協議、web框架閱讀目錄一 Web應用程式是什麼二基於SOCKET寫一個web應用一、web應用、http協議、web框架一 Web應用程式是什麼 Web應用程式是一種可以通過Web訪

Java 從零開始學爬蟲（gecco）

廢話：第一次學習並嘗試分析、爬取一個網站的資料，全部是從零開始的經驗，希望對各位看官有幫助，當然，本次爬取的是一個比較簡單的網頁，沒有任何反爬蟲措施的網頁。網上查了一下Java爬資料，最原始的方式是用請求網頁的字串然後用正則解析標籤，再查了一下有什麼爬蟲、解析

從零開始學Linux（一）

Linux 基本命令：遍歷目錄：在 Linux 檔案系統上，可以使用切換目錄命令 cd 將 shell 會話切換到另一個目錄：格式：cd destination cd 命令可以接受單個引數；如果沒有引數，則將切換到使用者主目錄。 destination 引數可以用倆種方式表示：

從零開始學caffe（四）：mnist手寫數字識別網路結構模型和超引數檔案的原始碼閱讀

相關推薦