darknet原始碼剖析(三)
進入train_detector函式。
list *options = read_data_cfg(datacfg);
list的定義位於darknet.h,為連結串列。read_data_cfg位於option_list.c中。
read_data_cfg的作用在於將資料集配置轉化為連結串列。
char *train_images = option_find_str(options, "train", "data/train.list"); char *backup_directory = option_find_str(options, "backup", "/backup/");
option_find_str用於尋找選項指定的內容,若沒有指定則使用預設值。在當前程式執行環境中“train”與“backup”均已指定。
srand(time(0));
char *base = basecfg(cfgfile);
printf("%s\n", base);
float avg_loss = -1;
network **nets = calloc(ngpus, sizeof(network));
其中比較重要的basecfg(cfgfile),這一句的作用在於提取模型檔案的名稱(“.”之前的部分)。在當前程式中是“yolov3-voc”。
network **nets = calloc(ngpus, sizeof(network));用於為網路分配記憶體空間。network的定義為darknet.h中。為每個gpu分配一個network。
srand(time(0)); int seed = rand(); int i; for(i = 0; i < ngpus; ++i){ srand(seed); #ifdef GPU cuda_set_device(gpus[i]); #endif nets[i] = load_network(cfgfile, weightfile, clear); nets[i]->learning_rate *= ngpus; } srand(time(0)); network *net = nets[0];
若在makefile中設定了GPU,則執行cuda_set_device,該函式位於cuda.c檔案中。
load_network函式位於network.c檔案中。
network *load_network(char *cfg, char *weights, int clear)
{
network *net = parse_network_cfg(cfg);
if(weights && weights[0] != 0){
load_weights(net, weights);
}
if(clear) (*net->seen) = 0;
return net;
}
parse_network_cfg函式用於解析模型配置檔案,load_weights函式用於載入預訓練引數。在此不詳細分析,load_network函式執行完畢後返回yolov3模型。
learning_rate*ngpus的作用暫不清楚。
srand(time(0));
network *net = nets[0];
int imgs = net->batch * net->subdivisions * ngpus;
printf("Learning Rate: %g, Momentum: %g, Decay: %g\n", net->learning_rate, net->momentum, net->decay);
data train, buffer;
imgs可能是圖片的總張數。
layer l = net->layers[net->n - 1];
int classes = l.classes;
float jitter = l.jitter;
net->n代表網路的總層數,net->layers[net->n-1]代表網路最後一層,net從0開始計數。
layer l的內容結合yolov3-voc.cfg的內容可以知道,
[yolo]
mask = 0,1,2
anchors = 10,13, 16,30, 33,23, 30,61, 62,45, 59,119, 116,90, 156,198, 373,326
classes=20
num=9
jitter=.3
ignore_thresh = .5
truth_thresh = 1
random=1
因此classes為20,jitter為0.3。
list *plist = get_paths(train_images);
//int N = plist->size;
char **paths = (char **)list_to_array(plist);
get_paths將train_images檔案中的訓練資料轉化為list,train_images檔案為txt格式,儲存的是所有訓練資料儲存的地址。
list_to_array將list轉化為二維字元矩陣,用於儲存訓練資料儲存的地址。
load_args args = get_base_args(net);
args.coords = l.coords;
args.paths = paths;
args.n = imgs;
args.m = plist->size;
args.classes = classes;
args.jitter = jitter;
args.num_boxes = l.max_boxes;
args.d = &buffer;
args.type = DETECTION_DATA;
//args.type = INSTANCE_DATA;
args.threads = 64;
上述程式碼的功能是設定模型引數