YOLOV3實戰4：Darknet中cfg檔案說明和理解

阿新 • • 發佈：2018-12-18

大家好，我是小p，從今天起，將逐漸從原始碼角度解析Darknet,歡迎加入物件檢測群813221712討論和交流，進群請看群公告！今天將要說明的是Darknet中的cfg檔案，廢話少說，直接幹！（以cfg/yolov3.cfg為例，其它類似）

[net]                        ★ [xxx]開始的行表示網路的一層，其後的內容為該層的引數配置，[net]為特殊的層，配置整個網路
# Testing                    ★ #號開頭的行為註釋行，在解析cfg的檔案時會忽略該行
# batch=1
# subdivisions=1
# Training
batch=64                     ★ 這兒batch與機器學習中的batch有少許差別，僅表示網路積累多少個樣本後進行一次BP 
subdivisions=16              ★ 這個引數表示將一個batch的圖片分sub次完成網路的前向傳播
                             ★★ 敲黑板：在Darknet中，batch和sub是結合使用的，例如這兒的batch=64，sub=16表示訓練的過
                             程中將一次性載入64張圖片進記憶體，然後分16次完成前向傳播，意思是每次4張，前向傳播的迴圈過程中
                             累加loss求平均，待64張圖片都完成前向傳播後，再一次性後傳更新引數
                             ★★★ 調參經驗：sub一般設定16，不能太大或太小，且為8的倍數，其實也沒啥硬性規定，看著舒服就好
                             batch的值可以根據視訊記憶體佔用情況動態調整，一次性加減sub大小即可，通常情況下batch越大越好，還需
                             注意一點，在測試的時候batch和sub都設定為1，避免發生神祕錯誤！

width=608                    ★ 網路輸入的寬width
height=608                   ★ 網路輸入的高height
channels=3                   ★ 網路輸入的通道數channels
                             ★★★ width和height一定要為32的倍數，否則不能載入網路
                             ★ 提示：width也可以設定為不等於height，通常情況下，width和height的值越大，對於小目標的識別
                             效果越好，但受到了視訊記憶體的限制，讀者可以自行嘗試不同組合
                             
momentum=0.9                 ★ 動量 DeepLearning1中最優化方法中的動量引數，這個值影響著梯度下降到最優值得速度
decay=0.0005                 ★ 權重衰減正則項，防止過擬合

angle=0                      ★ 資料增強引數，通過旋轉角度來生成更多訓練樣本
saturation = 1.5             ★ 資料增強引數，通過調整飽和度來生成更多訓練樣本
exposure = 1.5               ★ 資料增強引數，通過調整曝光量來生成更多訓練樣本
hue=.1                       ★ 資料增強引數，通過調整色調來生成更多訓練樣本

learning_rate=0.001          ★ 學習率決定著權值更新的速度，設定得太大會使結果超過最優值，太小會使下降速度過慢。
                             如果僅靠人為干預調整引數，需要不斷修改學習率。剛開始訓練時可以將學習率設定的高一點，
                             而一定輪數之後，將其減小在訓練過程中，一般根據訓練輪數設定動態變化的學習率。
                             剛開始訓練時：學習率以 0.01 ~ 0.001 為宜。一定輪數過後：逐漸減緩。
                             接近訓練結束：學習速率的衰減應該在100倍以上。
                             學習率的調整參考https://blog.csdn.net/qq_33485434/article/details/80452941
                             ★★★ 學習率調整一定不要太死，實際訓練過程中根據loss的變化和其他指標動態調整，手動ctrl+c結
                             束此次訓練後，修改學習率，再載入剛才儲存的模型繼續訓練即可完成手動調參，調整的依據是根據訓練
                             日誌來，如果loss波動太大，說明學習率過大，適當減小，變為1/5，1/10均可，如果loss幾乎不變，
                             可能網路已經收斂或者陷入了局部極小，此時可以適當增大學習率，注意每次調整學習率後一定要訓練久
                             一點，充分觀察，調參是個細活，慢慢琢磨
                             ★★ 一點小說明：實際學習率與GPU的個數有關，例如你的學習率設定為0.001，如果你有4塊GPU，那
                             真實學習率為0.001/4
burn_in=1000                 ★ 在迭代次數小於burn_in時，其學習率的更新有一種方式，大於burn_in時，才採用policy的更新方式
max_batches = 500200         ★ 訓練次數達到max_batches後停止學習，一次為跑完一個batch

policy=steps                 ★ 學習率調整的策略：constant, steps, exp, poly, step, sig, RANDOM，constant等方式
                             參考https://nanfei.ink/2018/01/23/YOLOv2%E8%B0%83%E5%8F%82%E6%80%BB%E7%BB%93/#more
steps=400000,450000          
scales=.1,.1                 ★ steps和scale是設定學習率的變化，比如迭代到400000次時，學習率衰減十倍，45000次迭代時，學
                             習率又會在前一個學習率的基礎上衰減十倍

[convolutional]              ★ 一層卷積層的配置說明
batch_normalize=1            ★ 是否進行BN處理，什麼是BN此處不贅述，1為是，0為不是 
filters=32                   ★ 卷積核個數，也是輸出通道數
size=3                       ★ 卷積核尺寸
stride=1                     ★ 卷積步長
pad=1                        ★ 卷積時是否進行0 padding,padding的個數與卷積核尺寸有關，為size/2向下取整，如3/2=1
activation=leaky             ★ 網路層啟用函式
                             ★★ 卷積核尺寸3*3配合padding且步長為1時，不改變feature map的大小
                             
# Downsample
[convolutional]              ★ 下采樣層的配置說明
batch_normalize=1
filters=64
size=3
stride=2
pad=1
activation=leaky             ★★ 卷積核尺寸為3*3，配合padding且步長為2時，feature map變為原來的一半大小

[shortcut]                   ★ shotcut層配置說明
from=-3                      ★ 與前面的多少次進行融合，-3表示前面第三層
activation=linear            ★ 層次啟用函式
    ......
    ......
[convolutional]              ★ YOLO層前面一層卷積層配置說明
size=1
stride=1
pad=1
filters=255                  ★ filters=num(預測框個數)*(classes+5)，5的意義是4個座標加一個置信率，論文中的tx,ty,tw,th,
                             c，classes為類別數，COCO為80,num表示YOLO中每個cell預測的框的個數，YOLOV3中為3
                             ★★★ 自己使用時，此處的值一定要根據自己的資料集進行更改，例如你識別4個類，則：
                             filters=3*(4+5)=27,三個fileters都需要修改，切記
activation=linear

[yolo]                       ★ YOLO層配置說明
mask = 0,1,2                 ★  使用anchor的索引，0，1，2表示使用下面定義的anchors中的前三個anchor
anchors = 10,13,  16,30,  33,23,  30,61,  62,45,  59,119,  116,90,  156,198,  373,326   
classes=80                   ★ 類別數目
num=9                        ★ 每個grid cell總共預測幾個box,和anchors的數量一致。當想要使用更多anchors時需要調大num
jitter=.3                    ★ 資料增強手段，此處jitter為隨機調整寬高比的範圍，該引數不好理解，在我的原始碼註釋中有詳細說明
ignore_thresh = .7
truth_thresh = 1             ★ 參與計算的IOU閾值大小.當預測的檢測框與ground true的IOU大於ignore_thresh的時候，參與
                             loss的計算，否則，檢測框的不參與損失計算。
                             ★ 理解：目的是控制參與loss計算的檢測框的規模，當ignore_thresh過於大，接近於1的時候，那麼參與
                             檢測框迴歸loss的個數就會比較少，同時也容易造成過擬合；而如果ignore_thresh設定的過於小，那麼
                             參與計算的會數量規模就會很大。同時也容易在進行檢測框迴歸的時候造成欠擬合。
                             ★ 引數設定：一般選取0.5-0.7之間的一個值，之前的計算基礎都是小尺度（13*13）用的是0.7，
                             （26*26）用的是0.5。這次先將0.5更改為0.7。參考：https://www.e-learn.cn/content/qita/804953
random=1                     ★ 為1開啟隨機多尺度訓練，為0則關閉
                             ★★ 提示：當開啟隨機多尺度訓練時，前面設定的網路輸入尺寸width和height其實就不起作用了，width
                             會在320到608之間隨機取值，且width=height，沒10輪隨機改變一次，一般建議可以根據自己需要修改
                             隨機尺度訓練的範圍，這樣可以增大batch，望讀者自行嘗試！

碼字不易，且行且珍惜，再次歡迎各位入群交流討論，讓我們一起coding！

YOLOV3實戰4：Darknet中cfg檔案說明和理解

大家好，我是小p，從今天起，將逐漸從原始碼角度解析Darknet,歡迎加入物件檢測群813221712討論和交流，進群請看群公告！今天將要說明的是Darknet中的cfg檔案，廢話少說，直接幹！（以cfg/yolov3.cfg為例，其它類似） [net]

Exchange企業實戰技巧：郵件中使用數字簽名和郵件加密功能

clip 節點模式 chan 打開 ont 發送菜單欄電子郵件 SMTP最初是為了在封閉的網絡中傳送相對來說不太重要的簡短郵件，因此SMTP傳輸郵件時，安全性不高。自從安全、多用途INTERNET郵件擴展(S/MIME)成為增強SMTP電子郵件安全功能的標準，使得實現

【JAVAWEB學習筆記】網上商城實戰4：訂單模塊

接收筆記網上商城詳情 src head 分頁查詢 cnblogs logs 今日任務完成訂單模塊的功能 1.1 訂單模塊的功能 1.1.1 我的訂單：【我的訂單的查詢】 * 在header.jsp中點擊我的訂單. * 提交到Servlet:

Web前端開發實戰4：導航菜單(一)

pan 解決博文 xmlns 背景圖 20px mar 水平經典在前面的博文中我們提到橫向一級菜單，這裏我們來看看導航菜單。導航菜單種類非常多，可是制作原理都是大同小異的。這裏看的比二級下拉式菜單還簡單。來看一些站點上的導航菜單：

改善C#程序的建議4：C#中標準Dispose模式的實現

答案 weight except 垃圾回收器 min 發現使用 ont 普通原文:改善C#程序的建議4：C#中標準Dispose模式的實現需要明確一下C#程序（或者說.NET）中的資源。簡單的說來，C#中的每一個類型都代表一種資源，而資源又分為兩類：托管資源：由CL

Spring實戰筆記：Web中的Spring

web spring一.構建Spring Web應用1.Spring MVC中用戶請求處理上圖展示了請求使用Spring MVC所經歷的所有站點。 1：在請求離開瀏覽器時，會帶有所有請求內容的信息，至少會包含請求的URL。請求通過Spring的DispatcherServlet前

資料庫SQL實戰4：查詢所有已經分配部門的員工的last_name和first_name

思想：題目要求查詢所有已經分配部門的員工的last_name和first_name。由於部門號和員工資訊在兩個表中，但兩張表中都有員工編號資訊。所以可以根據員工的編號(where e.emp_no = d.emp_no)來確定該員工分配的部門和員工的last_name和first_name。

機器學習實戰系列：sklearn 中模型儲存的兩種方法

一、 sklearn中提供了高效的模型持久化模組joblib，將模型儲存至硬碟。 from sklearn.externals import joblib #lr是一個LogisticRegression模型 joblib.dump(lr, 'lr.model') lr =

YOLOV3實戰5：利用三方工具繪製P-R曲線

大家好，我是小p，這篇文章主要給大家介紹一下如何利用第三方指令碼繪製P-R曲線。對“物件檢測”感興趣的小夥伴，歡迎加入物件檢測群813221712討論和交流，進群請看群公告！說明：本教程是基於KITTI的評價矩陣標準進行的，會繪製3條曲線，分別是Easy，

YOLOV3實戰2：訓練自己的資料集，你不可能出錯！

大家好，我是小p，今天給大家帶來一期用darknet版本YOLO V3訓練自己資料集的教程，希望大家喜歡。歡迎加入物件檢測群813221712討論和交流，進群請看群公告！一、搭建環境搭建環境和驗證環境是否已經正確配置已在YOLOV3實戰1中詳細介紹，請一定

TensorFlow實戰4：實現簡單的多層神經網路案例

這篇文章記錄一下使用TensorFlow實現卷積神經網路的過程，資料集採用的還是MNIST資料集，使用了兩層的卷積來進行計算，整個過程在jupyter notebook中完成，具體步驟和程式碼展示如下： 1.環境設定 import numpy as np

vue.js移動端app實戰4：上拉載入以及下拉重新整理

上拉載入以及下拉重新整理都是移動端很常見的功能，在搜尋或者一些分類列表頁面常常會用到。http://www.tuicool.com/articles/Vfmu6rR 跟橫向滾動一樣，我們還是採用better-scroll這個庫來實現。由於better已經更新了新的版

PowerShell實戰4：批量修改AD賬戶E-Mail屬性

function Change_Mail { Process { $root = [ADSI]"" $rootdn = $root.distinguishedName $user = [ADSI]("LDAP://CN=$_,OU=AA

解決：springboot中properties檔案不能自動提示

電腦剛安裝springboot，發現application.properties檔案中不能自動提示，百度了很久也沒找到答案，琢磨了一下自己解決了，這邊記錄一下，避免下次再走彎路吧！解決方案：1.Help

Web前端開發實戰4：導航選單(一)

在前面的博文中我們提到橫向一級選單，這裡我們來看看導航選單。導航選單種類很多，但是製作原理都是大同小異的，這裡看的比二級下拉式選單還簡單。來看一些網站上的導航選單：垂直

caffe實戰記：caffe中python的介面函式

Caffe提供了python的介面（pycaffe），詳見caffe/python資料夾。在python程式碼中import caffe，可以load models（匯入模型），forward an

初探Java設計模式4：JDK中的設計模式

細節領取 chain water for 微信 form 模型學習經驗 JDK中設計模式本文主要是歸納了JDK中所包含的設計模式，包括作用和其設計類圖。首先來個總結，具體的某個模式可以一個一個慢慢寫，希望能對研究JDK和設計模式有所幫助。一、設計模式是什麽（1）反復出現

linux實戰考試題：批量創建用戶和密碼（不能使用循環）

linux 實戰批量創建10個用戶，並且設置隨機8位密碼，要求不能用shell的循環（例如：for,while等），只能用linux命令及管道實現。方法1：[[email protected]/* */ /]# echo stu{01..10}|tr " " "\n"|sed -r ‘s

SSM-MyBatis-07：Mybatis中SqlSession的insert和delete底層到底做了什麽

src batis mit image updating obj color idea快捷鍵手動先點進去看一下insert方法用ctrl加鼠標左鍵點進去看　　發現是一個接口SqlSession的方法，沒有實現，但是通過裏氏替換原則的想法，他是接口接收了實現類，所

SSM-MyBatis-10：Mybatis中SqlSession的getMapper()和簡單的工具類MyBatisUtils

dao input eat -m style nfa put creat factor ------------吾亦無他,唯手熟爾，謙卑若愚，好學若饑------------- getMapper的作用，獲取到接口，直接通過點的方式調用方法，以免直接手打的方

YOLOV3實戰4：Darknet中cfg檔案說明和理解

相關推薦