darknet原始碼解讀-letterbox_image

阿新 • • 發佈：2019-02-14

letterbox_image對影象調整成輸入尺寸(w,h)

//將原圖進行一定比例的縮放,返回的圖片尺寸為(w,h)
image letterbox_image(image im, int w, int h)
{
    int new_w = im.w;
    int new_h = im.h;

	//在保證影象寬高比不變的情況下,計算放縮後的寬高
    if (((float)w/im.w) < ((float)h/im.h)) {
		//這個說明高度比例大於寬度比例,所以new_h要重新設定
        new_w = w;
        new_h = (im.h * w)/im.w;
    } else {
        new_h = h;
        new_w = (im.w * h)/im.h;
    }
    image resized = resize_image(im, new_w, new_h);
    image boxed = make_image(w, h, im.c); 
	
    fill_image(boxed, .5); //填充,why 0.5?相當於127,灰度!
    //int i;
    //for(i = 0; i < boxed.w*boxed.h*boxed.c; ++i) boxed.data[i] = 0;

	//將放縮後的圖片複製入boxed圖片正中央
    embed_image(resized, boxed, (w-new_w)/2, (h-new_h)/2); 
    free_image(resized); //resized儲存的是圖片放縮的中間結果,臨時用
    return boxed; //返回的影象尺寸為需要的(w,h)
}

按照偏移(dx,dy)將source中的影象移動到dest中，source和dest都是darknet中自定義的image結構，儲存影象的基本資訊，以及

通過一維陣列的形式儲存了影象的原始資料(可能是標準化後的資料)。

//move image from source to dest according to the offset (dx,dy)
void embed_image(image source, image dest, int dx, int dy)
{
    int x,y,k;
    for(k = 0; k < source.c; ++k){
        for(y = 0; y < source.h; ++y){
            for(x = 0; x < source.w; ++x){
				//channel->height->width
                float val = get_pixel(source, x,y,k);
                set_pixel(dest, dx+x, dy+y, k, val);
            }
        }
    }
}

darknet原始碼解讀-letterbox_image

letterbox_image對影象調整成輸入尺寸(w,h) //將原圖進行一定比例的縮放,返回的圖片尺寸為(w,h) image letterbox_image(image im, int w, int h) { int new_w = im.w; int

darknet原始碼解讀-load_data

這裡的資料載入部分的程式碼由detector.c檔案中train_detector函式中load_data處開始解讀。 void train_detector(char *datacfg, char *cfgfile, char *weightfile, int *

darknet原始碼解讀-yolov2損失計算

參考文章： yolov2損失計算的原始碼集中在region_layer.c檔案forward_region_layer函式中，為了兼顧座標、分類、目標置信度以及訓練效率，損失函式由多個部分組成，且不同部分都被賦予了各自的損失權重，整體計算公式如下。

YOLO原始碼（Darknet原始碼）解讀（im2col.c）

#include "im2col.h" #include <stdio.h> // 獲取影象畫素值 float im2col_get_pixel(float *im, int height, int width, int channels,

YOLO原始碼（Darknet原始碼）解讀（convolutional_layer.c）

#include "convolutional_layer.h" #include "utils.h" #include "batchnorm_layer.h" #include "im2col.h" #include "col2im.h" #include "blas.h" #include "g

YOLO原始碼（Darknet原始碼）解讀（layer.c）

#include "layer.h" #include "cuda.h" #include <stdlib.h> void free_layer(layer l) { if(l.type == DROPOUT){ if(l.rand) fr

YOLO原始碼（Darknet原始碼）解讀（network.c）

network.c #include <stdio.h> #include <time.h> #include <assert.h> #include "network.h" #include "image.h" #include "data.h" #inclu

YOLO原始碼（Darknet原始碼）解讀（utils.c）

utils.c #include <stdio.h> #include <stdlib.h> #include <string.h> #include <math.h> #include <assert.h> #include <u

YOLO原始碼（Darknet原始碼）解讀（yolo.c）

// 將檢測的boxes結果寫入檔案 void print_yolo_detections(FILE **fps, char *id, int total, int classes, int w, int h, detection *dets) { int i, j; for(i = 0; i

yolo v2 損失函式原始碼解讀

前提說明： 1, 關於 yolo 和 yolo v2 的詳細解釋請移步至如下兩個連結，或者直接看論文（我自己有想寫 yolo 的教程，但思前想後下面兩個連結中的文章質量實在是太好了_(:з」∠)_） yo

【React原始碼解讀】- 元件的實現

前言 react使用也有一段時間了，大家對這個框架褒獎有加，但是它究竟好在哪裡呢？讓我們結合它的原始碼，探究一二！（當前原始碼為react16，讀者要對react有一定的瞭解）回到最初根據react官網上的例子，快速構建react專案 npx create-react-app

【1】pytorch torchvision原始碼解讀之Alexnet

最近開始學習一個新的深度學習框架PyTorch。框架中有一個非常重要且好用的包：torchvision，顧名思義這個包主要是關於計算機視覺cv的。這個包主要由3個子包組成，分別是：torchvision.datasets、torchvision.models、torchvision.trans

Set介面_HashSet常用方法_JDK原始碼解讀

Set 介面繼承自 Collection ,Set 沒有新增方法，方法和 Collection 保持一致， Set 容器的特點：無序，不可重複，無序指Set 中的元素沒有索引，我們只能遍歷查詢，不重複指不允許加入重複的元素，更確切的說，新元素如果和Set 中某個元素通過 equals() 方

vux之x-input使用以及原始碼解讀

前言近期專案中使用的vux中的input，以及使用自定義校驗規則和動態匹配錯誤提示，有時間記錄下自己的使用經歷和原始碼分析。希望大家多多指正，留言區發表自己寶貴的建議。詳解列舉官方文件中常用的幾個屬性的使用方法，程式碼如下 <group ref="group">

react-redux connect原始碼解讀

今天看了下react-redux的原始碼，主要來看下connect的方法首先找到connect的入口檔案。在src/index.js下找到。對應connect資料夾下的connect.js檔案。大致說下原始碼connect流程 connect.js對外暴露是通過ex

java原始碼解讀之HashMap

1:首先下載openjdk(http://pan.baidu.com/s/1dFMZXg1),把原始碼匯入eclipse,以便看到jdk原始碼 Windows-Prefe

以太坊原始碼解讀（5）BlockChain類的解析及NewBlockChain()分析

一、blockchain的資料結構 type BlockChain struct { chainConfig *params.ChainConfig // 初始化配置 cacheConfig *CacheConfig // 快取配置 db ethdb.Databas

以太坊原始碼解讀（4）Block類及其儲存

一、Block類 type Block struct { /******header*******/ header *Header /******header*******/ /******body*********/ uncle

Hystrix之@EnableCircuitBreaker原始碼解讀

Hystrix是一個供分散式系統使用，提供延遲和容錯功能，保證複雜的分佈系統在面臨不可避免的失敗時，仍能有其彈性。比如系統中有很多服務，當某些服務不穩定的時候，使用這些服務的使用者執行緒將會阻塞，如果沒有隔離機制，系統隨時就有可能會掛掉，從而帶來很大的風險。 SpringCloud使用Hy

String的valueOf方法原始碼解讀

valueOf 中的祕密 String中的valueOf方法大致可以分為三種： String.valueOf(Object)、String.valueOf(char[])、String.valueOf(基本資料型別) 案例： Integer arg = null; St

darknet原始碼解讀-letterbox_image

相關推薦