darknet原始碼解讀-yolov2損失計算

阿新 • • 發佈：2019-01-15

參考文章：

yolov2損失計算的原始碼集中在region_layer.c檔案forward_region_layer函式中，為了兼顧座標、分類、目標置信度以及訓練效率，損失函式由多個部分組成，且不同部分都被賦予了各自的損失權重，整體計算公式如下。

圖：yolov2損失函式計算公式

W,H指的是特徵圖(13x13)的寬和高，A指每個網格單元(cell)對應的anchor box的數目(5)，各種 $\lambda$ 表示各類損失的權重。我們先看第1部分損失：

$L_{Max IoU < thresh}\lambda _{noobj} * (-b_{ijk}^{o})^{2}$

當Max IoU小於閾值thresh時，預測box為沒有目標，由以上公式計算沒有目標時的損失。觀察程式碼的話可以看到，首先預設將所有預測box都當做沒有目標進行了計算，後面當某個預測box的best_iou大於閾值時再將該預測box的目標置信度損失置為0。再來看下第2部分，座標迴歸損失：

當訓練的圖片數量小於12800張的時候計算這些圖片的座標(w,y,h,w)損失。

再看第3大項：

 for(t = 0; t < 30; ++t){
            box truth = float_to_box(net.truth + t*(l.coords + 1) + b*l.truths, 1);
            if(!truth.x) break;
			
            float best_iou = 0;
            int best_n = 0;
			
            i = (truth.x * l.w); //cell(j,i)
            j = (truth.y * l.h);
			
            box truth_shift = truth;
            truth_shift.x = 0;
            truth_shift.y = 0;

			for(n = 0; n < l.n; ++n){ 
                int box_index = entry_index(l, b, n*l.w*l.h + j*l.w + i, 0);
                box pred = get_region_box(l.output, l.biases, n, box_index, i, j, l.w, l.h, l.w*l.h);
                if(l.bias_match){
                    pred.w = l.biases[2*n]/l.w;
                    pred.h = l.biases[2*n+1]/l.h;
                }
				
                pred.x = pred.y = 0;

				float iou = box_iou(pred, truth_shift);
                if (iou > best_iou){
                    best_iou = iou;
                    best_n = n;
                }
            }

            int box_index = entry_index(l, b, best_n*l.w*l.h + j*l.w + i, 0);
            float iou = delta_region_box(truth, l.output, l.biases, best_n, box_index, 
				i, j, l.w, l.h, l.delta, l.coord_scale *  (2 - truth.w*truth.h), l.w*l.h);

            if(l.coords > 4){ //no exec
                int mask_index = entry_index(l, b, best_n*l.w*l.h + j*l.w + i, 4);
                delta_region_mask(net.truth + t*(l.coords + 1) + b*l.truths + 5, 
					l.output, l.coords - 4, mask_index, l.delta, l.w*l.h, l.mask_scale);
            }
			
            if(iou > .5) recall += 1;
            avg_iou += iou;

			//best predict box confidence
            int obj_index = entry_index(l, b, best_n*l.w*l.h + j*l.w + i, l.coords);
            avg_obj += l.output[obj_index];
			
			l.delta[obj_index] = l.object_scale * (1 - l.output[obj_index]);
            if (l.rescore) { 			
                l.delta[obj_index] = l.object_scale * (iou - l.output[obj_index]);
            }
		
            if(l.background){ //no exec
                l.delta[obj_index] = l.object_scale * (0 - l.output[obj_index]);
            }

            int class = net.truth[t*(l.coords + 1) + b*l.truths + l.coords];
            if (l.map) class = l.map[class];

			int class_index = entry_index(l, b, best_n*l.w*l.h + j*l.w + i, l.coords + 1);
			delta_region_class(l.output, l.delta, class_index, class, l.classes, 
				l.softmax_tree, l.class_scale, l.w*l.h, &avg_cat, !l.softmax); //class loss
            ++count;
            ++class_count;
        }

第3部分的損失計算與某個ground truth box匹配的預測框各部分的損失，包括座標誤差、置信度誤差和分類誤差。對於某個ground truth(外層for迴圈)，首先要確定其中心點要落在哪個cell上，然後計算這個cell的5個先驗框與ground truth的IoU值（YOLOv2中bias_match=1），計算IoU值時不考慮座標，只考慮形狀，所以先將先驗框與ground truth的中心點都偏移到原點，然後計算出對應的IOU值，IOU值最大的那個先驗框與ground truth匹配，對應的預測框用來預測這個ground truth。在計算obj置信度時，在YOLOv1中target=1，而YOLOv2增加了一個控制引數rescore，當其為1時，target取預測框與ground truth的真實IOU值。對於那些沒有與ground truth匹配的先驗框(與預測框對應)，除去那些Max_IOU低於閾值的，其它的就全部忽略，不計算任何誤差(l.deltas在分配空間時預設已置0)。這點在YOLOv3論文中也有相關說明：YOLO中一個ground truth只會與一個先驗框匹配（IOU值最好的），對於那些IOU值超過一定閾值的先驗框，其預測結果就忽略了。

darknet原始碼解讀-yolov2損失計算

darknet原始碼解讀-yolov2損失計算

darknet原始碼解讀-load_data

darknet原始碼解讀-letterbox_image

yolo v2 損失函式原始碼解讀

深度學習之---yolo,kmeans計算anchor框原始碼解讀

YOLO原始碼（Darknet原始碼）解讀（im2col.c）

YOLO原始碼（Darknet原始碼）解讀（convolutional_layer.c）

YOLO原始碼（Darknet原始碼）解讀（layer.c）

YOLO原始碼（Darknet原始碼）解讀（network.c）

YOLO原始碼（Darknet原始碼）解讀（utils.c）

YOLO原始碼（Darknet原始碼）解讀（yolo.c）

【React原始碼解讀】- 元件的實現

【1】pytorch torchvision原始碼解讀之Alexnet

Set介面_HashSet常用方法_JDK原始碼解讀

vux之x-input使用以及原始碼解讀

react-redux connect原始碼解讀

java原始碼解讀之HashMap

以太坊原始碼解讀（5）BlockChain類的解析及NewBlockChain()分析

以太坊原始碼解讀（4）Block類及其儲存

Hystrix之@EnableCircuitBreaker原始碼解讀

darknet原始碼解讀-yolov2損失計算

相關推薦