Darknet 程式碼分析（之二，parse_network_cfg_custom函式）

阿新 • • 發佈：2018-11-19

parse_network_cfg_custom函式中，讀取配置檔案是先把各個section讀取出來，然後再解析。
yolov3.cfg裡面只有幾個不同的section，分別是[net]、[convolutional]、[shortcut]、[yolo]、[route]、[upsample]，下面分別探究。

NET（全域性）

參考 YOLO配置檔案理解

引數名稱	型別	預設值	說明
Testing	-	-
Training	-	-
batch	int	1	前向計算梯度和通過反向傳導更新權重值的計算中一次處理的圖片檔案的數量。
subdivisions	int	1	批處理被細分為許多“塊”。塊的影象在gpu上並行執行。在darknet程式碼中，會將batch/subdivisions命名為batch，這個值設定比batch小往往回出現out out memory的問題。
width	int	416	影象的寬，32的倍數
height	int	416	影象的高，32的倍數
channels	int	3	按照stackflow上的說法，用下圖來表述channels=4的情況：在左邊，我們有一個4x4畫素的單一通道，重組層將大小減小到一半，然後在不同通道中建立4個相鄰畫素的通道。我認為可能是表示顏色通道。
momentum	float	0.9	見深度學習中momentum的作用一文的解釋
decay	float	0.0005	權重衰減正則項，防止過擬合
angle	int	0	通過旋轉角度來生成更多訓練樣本
saturation	float	1.5	通過調整飽和度來生成更多訓練樣本
exposure	float	1.5	通過調整曝光量來生成更多訓練樣本
hue	float	0.1	通過調整色調來生成更多訓練樣本
learning_rate	float	0.001	初始學習率
burn_in	int	1000	對於第首個burn_in批的訓練，緩慢地提高學習率，直到它的最終值等於learning_rate設定的值。通過對學習率的監控可以瞭解到對於Loss函式的收斂的貢獻情況
max_batches	int	1000	訓練達到max_batches後停止學習
policy	string	steps	調整學習率的策略。policy取值：CONSTANT, STEP, EXP, POLY, STEPS, SIG, RANDOM。policy=steps 表示使用下面的steps引數和scales引數來調整訓練時的學習速度
steps	int array	1000,2000	如取值是1000,2000，則表示在第1000個訓練批次和2000個批次後調整learning_rate
scales	float array	0.1,0.1	在1000個訓練批次後，LR = 0.1, 然後在2000個訓練批次後LR *= 0.1, 也就是說再執行一次調整

在這裡插入圖片描述

convolutional

引數：

引數名稱	型別	預設值	說明
batch_normalize	bool	1	是否非規範化這個layer，見函式denormalize_convolutional_layer
filters	int	255	輸出多少個特徵圖。filters =(classes + 5) x 3
size	int	3	卷積核的尺寸
stride	int	1	卷積運算的步長
pad	bool	0	指定padding的方式
padding	int	0	padding由 padding引數指定。如果pad為1，padding大小為size/2
activation	string	logistic	“logistic”、“loggy”、“relu”、“elu”、“relie”、“plse”、“hardtan”、 “lhtan”、 “linear”、ramp"、“leaky”、“tanh”、"stair"是合法的啟用函式值。
binary	int	0	暫未見使用，先不管
xnor	int	0	暫未見使用，先不管
bin_output	int	0	暫未見使用，先不管

相應程式碼段：

    int n = option_find_int(options, "filters",1);
    int size = option_find_int(options, "size",1);
    int stride = option_find_int(options, "stride",1);
    int pad = option_find_int_quiet(options, "pad",0);
    int padding = option_find_int_quiet(options, "padding",0);
    if(pad) padding = size/2;
    char *activation_s = option_find_str(options, "activation", "logistic");
    int batch_normalize = option_find_int_quiet(options, "batch_normalize", 0);
    int binary = option_find_int_quiet(options, "binary", 0);
    int xnor = option_find_int_quiet(options, "xnor", 0);
    int use_bin_output = option_find_int_quiet(options, "bin_output", 0);

shortcut

引數：

引數名稱	型別	預設值	說明
shortcut	int	-	指向其他layer的索引偏移值，yolov3裡面是-3
activation	string	-	啟用函式型別，yolov3裡面是“linear”

相應程式碼段：

layer parse_shortcut(list *options, size_params params, network net)
{
    char *l = option_find(options, "from");
    int index = atoi(l);
    if(index < 0) index = params.index + index;

    int batch = params.batch;
    layer from = net.layers[index];

    layer s = make_shortcut_layer(batch, index, params.w, params.h, params.c, from.out_w, from.out_h, from.out_c);

    char *activation_s = option_find_str(options, "activation", "linear");
    ACTIVATION activation = get_activation(activation_s);
    s.activation = activation;
    return s;
}

yolo

引數：

引數名稱	型別	預設值
classes	int	20
num	int	1
mask	int	0
max	int	90
jitter	float	0.2
focal_loss	int	0
ignore_thresh	float	0.5
truth_thresh	int	1
random	int	0
map	string	“”
anchors	string	“”

相應程式碼段：

layer parse_yolo(list *options, size_params params)
{
    int classes = option_find_int(options, "classes", 20);
    int total = option_find_int(options, "num", 1);
    int num = total;

    char *a = option_find_str(options, "mask", 0);
    int *mask = parse_yolo_mask(a, &num);
    int max_boxes = option_find_int_quiet(options, "max", 90);
    layer l = make_yolo_layer(params.batch, params.w, params.h, num, total, mask, classes, max_boxes);
    if (l.outputs != params.inputs) {
        printf("Error: l.outputs == params.inputs \n");
        printf("filters= in the [convolutional]-layer doesn't correspond to classes= or mask= in [yolo]-layer \n");
        exit(EXIT_FAILURE);
    }
    //assert(l.outputs == params.inputs);

    //l.max_boxes = option_find_int_quiet(options, "max", 90);
    l.jitter = option_find_float(options, "jitter", .2);
    l.focal_loss = option_find_int_quiet(options, "focal_loss", 0);

    l.ignore_thresh = option_find_float(options, "ignore_thresh", .5);
    l.truth_thresh = option_find_float(options, "truth_thresh", 1);
    l.random = option_find_int_quiet(options, "random", 0);

    char *map_file = option_find_str(options, "map", 0);
    if (map_file) l.map = read_map(map_file);

    a = option_find_str(options, "anchors", 0);
    if (a) {
        int len = strlen(a);
        int n = 1;
        int i;
        for (i = 0; i < len; ++i) {
            if (a[i] == ',') ++n;
        }
        for (i = 0; i < n && i < total*2; ++i) {
            float bias = atof(a);
            l.biases[i] = bias;
            a = strchr(a, ',') + 1;
        }
    }
    return l;
}

route

route layer只有一個引數，layers，指定一個輸入的layer。

route_layer parse_route(list *options, size_params params, network net)
{
    char *l = option_find(options, "layers");
    int len = strlen(l);
    if(!l) error("Route Layer must specify input layers");
    int n = 1;
    int i;
    for(i = 0; i < len; ++i){
        if (l[i] == ',') ++n;
    }

    int *layers = calloc(n, sizeof(int));
    int *sizes = calloc(n, sizeof(int));
    for(i = 0; i < n; ++i){
        int index = atoi(l);
        l = strchr(l, ',')+1;
        if(index < 0) index = params.index + index;
        layers[i] = index;
        sizes[i] = net.layers[index].outputs;
    }
    int batch = params.batch;

    route_layer layer = make_route_layer(batch, n, layers, sizes);

    convolutional_layer first = net.layers[layers[0]];
    layer.out_w = first.out_w;
    layer.out_h = first.out_h;
    layer.out_c = first.out_c;
    for(i = 1; i < n; ++i){
        int index = layers[i];
        convolutional_layer next = net.layers[index];
        if(next.out_w == first.out_w && next.out_h == first.out_h){
            layer.out_c += next.out_c;
        }else{
            layer.out_h = layer.out_w = layer.out_c = 0;
        }
    }

    return layer;
}

upsample

顧名思義，這個layer是用來做上取樣的，只有stride和scale兩個引數，程式碼如下

layer parse_upsample(list *options, size_params params, network net)
{

    int stride = option_find_int(options, "stride", 2);
    layer l = make_upsample_layer(params.batch, params.w, params.h, params.c, stride);
    l.scale = option_find_float_quiet(options, "scale", 1);
    return l;
}

Darknet 程式碼分析（之二，parse_network_cfg_custom函式）

parse_network_cfg_custom函式中，讀取配置檔案是先把各個section讀取出來，然後再解析。 yolov3.cfg裡面只有幾個不同的section，分別是[net]、[convolutional]、[shortcut]、[yolo]、[route]、[upsample]

Darknet 程式碼分析（之一，準備工作）

用yolo v3檢測圖片中的某種植物，沒找到網路定義檔案中的說明，看一下darknet的程式碼，做個筆記。程式碼來源： Alexey AB維護的Darknet 版本： https://github.com/AlexeyAB/darknet 關於訓練自己的資料，說明見 https:/

仁潤雲丨網絡小貸風控數據接口分析（多頭借貸，芝麻信用）

分析 pan 偽造行為貸款精準決策風險規則對於網絡小貸平臺而言，征信和風控是業務發展過程中的重要環節。網絡小貸業務主要防範的是欺詐風險和信用風險，諸如借款人通過套現、偽造、冒領冒用、惡意透支等手段進行騙貸。此外，平臺與平臺之間信息不透明，用戶同時在多個平臺重復

仁潤雲丨網路小貸風控資料介面分析（多頭借貸，芝麻信用）

對於網路小貸平臺而言，徵信和風控是業務發展過程中的重要環節。網路小貸業務主要防範的是欺詐風險和信用風險，諸如借款人通過套現、偽造、冒領冒用、惡意透支等手段進行騙貸。此外，平臺與平臺之間資訊不透明，使用者同時在多個平臺重複借貸等不良現象時常出現，市場資料共享機制有待完善。關於網路小貸風控，常

iOS 崩潰日誌分析（個人總結，最實用）

要分析奔潰日誌需要三個檔案：crash日誌，symbolicatecrash分析工具，.dSYM符號集 0. 在桌面建立一個crash資料夾 1. 需要Xcode自帶的崩潰分析工具symbolicatecrash，這個檔案的位置參考：/Applications/Xcode.

python和函式的故事（預設引數，匿名函式）

預設引數 python為了簡化函式的呼叫，提供了預設的引數機制製作一個函式，名為pow,傳入預設形參n=2,計算任意一個數的平方 def pow(x, n = 2): #定義一個函式pow，傳入形參x,設定形參n=2，如果實參中沒有指定的

基於Visual C++之Windows核心程式設計程式碼分析（1）實現裝置管理器列舉裝置

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

無業務不伸縮之二，雲監控搭配SLB及ESS（進階篇）

雲端計算ESS彈性伸縮課程無業務不伸縮之二，雲監控搭配SLB及ESS（進階篇）連載雲端計算文章主題後續的連載如下1、無業務不伸縮之一，雲端計算有ESS2、無業務不伸縮之二，雲監控搭配SLB及ESS3、無互動不加速，雲端計算有CDN4、無對像不儲存，雲端計算有OSS5、無檔案不儲存，雲端計算有”

基於visual c++之windows核心程式設計程式碼分析（21）獲取和設定環境變數

環境變數是一個具有特定名字的物件，它包含了一個或者多個應用程式所將使用到的資訊。例如path，當要求系統執行一個程式而沒有告訴它程式所在的完整路徑時，系統除了在當前目錄下面尋找此程式外，還應到path中指定的路徑去找。使用者通過設定環境變數，來更好的執行程序。環境變數一

openssl之aes加密（原始碼分析 AES_encrypt 與 AES_cbc_encrypt ，加密模式）

首先要了解AES加密是什麼，以及幾種加密模式的區別。之後才是程式設計。具體的程式設計案例，在下面的連結。下面這個連結有詳細圖解。http://www.cnblogs.com/adylee/

appium python-client程式碼分析（二）

先來看最重要的一個檔案：webdriver.py https://github.com/appium/python-client/tree/master/appium/webdriver #!/usr/bin/env python # Licensed under t

UNIX v6原始碼分析除錯之二：單步除錯系統程式碼 main函式之 kinit1

環境搭建完成，該學習Main.c的main函數了。先貼上main函式的實現。int main(void) { kinit1(end, P2V(4*1024*1024)); // phys page allocator kvmalloc(); // k

《喬布斯傳》經典摘錄之iphone【天線門】事件二(解決、總結、分析)（十二）...

此部分內容主要講iphone【天線門】事件如何解決、總結和分析週五，蘋果在公司禮堂舉辦了新聞釋出會，喬布斯採納了麥肯納的意見。他沒有卑躬屈膝，也沒有道歉，只表示蘋果理解這個問題並會盡力改正，這樣他就得以平息問題。接著，他話題一轉

語義網技術（2）：jena的使用——更多示例和程式碼分析（上，例子從例2-例5）

已經畢業了，論文也交了，總算輕鬆一點了，現在也準備把RDF相關知識和Jena的程式設計技術統一做個總結，寫個系列的部落格，一來是相當於給自己做個筆記，二來也是分享一些自己學到的東西，提供一些資源，以供大家共同學習。這次準備把Jena示例中其他幾個程式的程式碼解釋一下，而後將簡

Linux 網路協議棧開發程式碼分析篇之VLAN（三）—— VLAN收發處理

以一個例子來說明，當主機收到報文，交由vlan協議模組處理後(vlan_rcv)，此時需要更換skb->dev所指向的裝置，以使上層協議認為報文是來自於虛擬網絡卡(比如eth1.1)，而不知道網絡卡eth1的存在。更換裝置就需要知道skb->dev更換的目標。這由兩個因素決定：sk

基於visual c++之windows核心程式設計程式碼分析（18）遠端程式碼注入執行

我們進行系統級別的安全監控的時候，防範木馬的時候，經常需要進行遠端程式碼注入執行。執行步驟如下1. 提升程序許可權，如果許可權不夠的話，很容易造成 OpenProcess 失敗;2. 確定你的宿主程序，即你所要注入程式碼的程序，這個其實很好辦，你要是不想你的木馬或者病毒被別個

基於visual c++之windows核心程式設計程式碼分析（61）打造自己的Windows輸入法

IMM（Input Method Manager）只在安裝了亞洲語言包之後才能使用。通過呼叫GetSystemMetrics（SM_IMMENABLED）知道IMM是否使能。一共由三部分組成：status window 輸入法狀態列表示正在處於中文輸入狀態可以知道是什

Ogitor探索之程式碼分析（3）---CBaseEditor::showBoundingBox(bool bShow)

在Qtogitor中編輯場景時如何選中物體Object並讓它顯示出邊線（Ogitor稱它為Bounding Box）呢？前面已經介紹了OnMouseMove的功能了，如果不知道的要先看一下OnMouseMove的功能； 1、當滑鼠在螢幕上移動時OnMouseMove實時

Netty原始碼分析（十二）----- 心跳服務之 IdleStateHandler 原始碼分析

什麼是心跳機制？心跳說的是在客戶端和服務端在互相建立ESTABLISH狀態的時候，如何通過傳送一個最簡單的包來保持連線的存活，還有監控另一邊服務的可用性等。心跳包的作用保活Q：為什麼說心跳機制能保持連線的存活，它是叢集中或長連線中最為有效避免網路中斷的一個重要的保障措施？A：之所以說是&l

世紀佳緣登錄之二，修改

ssi channel ace 需要 blog esp lac osi url 今天發現世紀佳緣的以前登錄代碼不行了，登錄不成功。打印content後有毛病，沒跳轉過去。需要再次請求一下登錄後返回的<script type=‘text/javascript‘>

Darknet 程式碼分析（之二，parse_network_cfg_custom函式）

NET（全域性）

convolutional

shortcut

yolo

route

upsample

相關推薦