1. 程式人生 > >YOLO 9000測試過程和主要程式碼解析。

YOLO 9000測試過程和主要程式碼解析。

本人純屬新手,要是有什麼講的不對的地方,請各位大神批評指正。

yolo僅測試圖片所需要的配置不是很高,沒有裝cuda,沒有裝opencv也能跑起來,在cpu模式下,測試一張圖片需要6~7秒的時間。

下面是跑yolo程式碼的過程:

首先從官網克隆程式碼,以及下載預訓練的模型(一個正常版本的和一個快速版本的),前提是你不想訓練自己的模型的話。

克隆:git clone https://github.com/pjreddie/darknet

下載兩個預訓練模型,下載完放入darknet資料夾下面即可

http://pjreddie.com/media/files/yolo.weights
http://pjreddie.com/media/files/tiny-yolo-voc.weights
測試圖片:
cd darknet
make
./darknet detect cfg/yolo.cfg yolo.weights data/dog.jpg
這條語句的意思是進入darknet.c檔案,這個檔案在src資料夾中,然後進入darknet.c的main函式中,
main函式主要是判斷輸入的引數,判斷的時候以空格左鍵分隔符,下面給出main函式的主要程式碼:
int main(int argc, char **argv) #argc表示輸入引數的個數,argv是輸入引數的內容
{
    //test_resize("data/bad.jpg");
    //test_box();
    //test_convolutional_layer();
    if(argc < 2){
        fprintf(stderr, "usage: %s <function>\n", argv[0]);
        return 0;
    }
    gpu_index = find_int_arg(argc, argv, "-i", 0);
    if(find_arg(argc, argv, "-nogpu")) {
        gpu_index = -1;
    }

#ifndef GPU
    gpu_index = -1;
#else
    if(gpu_index >= 0){
        cuda_set_device(gpu_index);
    }
#endif

 if (0 == strcmp(argv[1], "average")){
        average(argc, argv);
    } else if (0 == strcmp(argv[1], "yolo")){
        run_yolo(argc, argv);
    } else if (0 == strcmp(argv[1], "voxel")){
        run_voxel(argc, argv);
    } else if (0 == strcmp(argv[1], "super")){
        run_super(argc, argv);
    } else if (0 == strcmp(argv[1], "detector")){
        run_detector(argc, argv);
    } else if (0 == strcmp(argv[1], "detect")){
        float thresh = find_float_arg(argc, argv, "-thresh", .24);
        char *filename = (argc > 4) ? argv[4]: 0;
        test_detector("cfg/coco.data", argv[2], argv[3], filename, thresh, .5);
...}
這個函式的作用就是判斷我們輸入的命令中的一些引數,像我們測試圖片就會檢測到“detect”這個關鍵字,然後讀取閾值(沒有的話預設是
0.24),讀取圖片的地址(沒有的話會提示讓你輸入圖片的路徑),然後就進入test_detector函式,下面貼出這個函式以及我做的一些備註:
void test_detector(char *datacfg, char *cfgfile, char *weightfile, char *filename, float thresh, float hier_thresh)
{
    list *options = read_data_cfg(datacfg);#讀取資料檔案
    char *name_list = option_find_str(options, "names", "data/names.list");  
     #讀取namelist(coco.name)
    char **names = get_labels(name_list);
     #讀取標籤
    image **alphabet = load_alphabet();
    #讀取labels下面的圖片
    network net = parse_network_cfg(cfgfile);
    #讀取網路架構
    if(weightfile){
        load_weights(&net, weightfile);
    }
    set_batch_network(&net, 1);
    #將網路的batch設定為1
    srand(2222222);
    clock_t time;#開始計時
    char buff[256];
    char *input = buff;
    int j;
    float nms=.4; #nms閾值
    while(1){
        if(filename){
            strncpy(input, filename, 256); #複製圖片路徑
        } else {
            printf("Enter Image Path: ");
            fflush(stdout);
            input = fgets(input, 256, stdin);
            if(!input) return;
            strtok(input, "\n");
        }
        image im = load_image_color(input,0,0);#
        image sized = resize_image(im, net.w, net.h);#將圖片的resize到416*416
        layer l = net.layers[net.n-1];#網路最後一層

        box *boxes = calloc(l.w*l.h*l.n, sizeof(box)); #分配box的空間
        float **probs = calloc(l.w*l.h*l.n, sizeof(float *));#分配分數的空間
        for(j = 0; j < l.w*l.h*l.n; ++j) probs[j] = calloc(l.classes + 1, sizeof(float *));

        float *X = sized.data;  #resize之後的圖片
        time=clock();
        network_predict(net, X);%開始檢測圖片,返回最後一層的輸出
        printf("%s: Predicted finised in %f seconds.\n", input, sec(clock()-time));
        get_region_boxes(l, 1, 1, thresh, probs, boxes, 0, 0, hier_thresh);#得到預測的所有框
        if (l.softmax_tree && nms) do_nms_obj(boxes, probs, l.w*l.h*l.n, l.classes, nms);
        else if (nms) do_nms_sort(boxes, probs, l.w*l.h*l.n, l.classes, nms);
#極大值抑制
        draw_detections(im, l.w*l.h*l.n, thresh, boxes, probs, names, alphabet, l.classes);
#輸出各個框的置信度得分以及畫出這些框
        save_image(im, "predictions");
        show_image(im, "predictions");

        free_image(im);
        free_image(sized);
        free(boxes);
        free_ptrs((void **)probs, l.w*l.h*l.n);
#ifdef OPENCV
        cvWaitKey(0);
        cvDestroyAllWindows();
#endif
        if (filename) break;
    }
}
上面中的每一個函式都在其他的.c檔案中能夠找到,不懂的可以去找一找。
下面給出如何在電腦上基於yolo演算法使用攝像頭進行檢測或者是檢測視訊:(前提是要裝好cuda和opencv)
./darknet detector demo cfg/coco.data cfg/yolo.cfg yolo.weights
這條命令是開啟攝像頭進行實時檢測,能檢測的類別數在data資料夾下面的coco.name中,這個檔案大家可以自行更改。
./darknet detector demo cfg/coco.data cfg/yolo.cfg yolo.weights <video file>
這條命令是檢測視訊,視訊要放在darknet的根目錄下面。
使用攝像頭或者是檢測 視訊都會進入run_detector()這個函式,下面貼出這個函式的程式碼,如果上面的檢測過程你很熟悉了,
那下面的程式碼看起來也不是很難了
void run_detector(int argc, char **argv)
{
    char *prefix = find_char_arg(argc, argv, "-prefix", 0);
    float thresh = find_float_arg(argc, argv, "-thresh", .24);
    float hier_thresh = find_float_arg(argc, argv, "-hier", .5);
    int cam_index = find_int_arg(argc, argv, "-c", 0);
    int frame_skip = find_int_arg(argc, argv, "-s", 0);
    if(argc < 4){
        fprintf(stderr, "usage: %s %s [train/test/valid] [cfg] [weights (optional)]\n", argv[0], argv[1]);
        return;
    }
    char *gpu_list = find_char_arg(argc, argv, "-gpus", 0);
    char *outfile = find_char_arg(argc, argv, "-out", 0);
    int *gpus = 0;
    int gpu = 0;
    int ngpus = 0;
    if(gpu_list){
        printf("%s\n", gpu_list);
        int len = strlen(gpu_list);
        ngpus = 1;
        int i;
        for(i = 0; i < len; ++i){
            if (gpu_list[i] == ',') ++ngpus;
        }
        gpus = calloc(ngpus, sizeof(int));
        for(i = 0; i < ngpus; ++i){
            gpus[i] = atoi(gpu_list);
            gpu_list = strchr(gpu_list, ',')+1;
        }
    } else {
        gpu = gpu_index;
        gpus = &gpu;
        ngpus = 1;
    }

    int clear = find_arg(argc, argv, "-clear");

    char *datacfg = argv[3];
    char *cfg = argv[4];
    char *weights = (argc > 5) ? argv[5] : 0;
    char *filename = (argc > 6) ? argv[6]: 0;
    if(0==strcmp(argv[2], "test")) test_detector(datacfg, cfg, weights, filename, thresh, hier_thresh);
    else if(0==strcmp(argv[2], "train")) train_detector(datacfg, cfg, weights, gpus, ngpus, clear);
    else if(0==strcmp(argv[2], "valid")) validate_detector(datacfg, cfg, weights, outfile);
    else if(0==strcmp(argv[2], "recall")) validate_detector_recall(cfg, weights);
    else if(0==strcmp(argv[2], "demo")) {
        list *options = read_data_cfg(datacfg);
        int classes = option_find_int(options, "classes", 20);
        char *name_list = option_find_str(options, "names", "data/names.list");
        char **names = get_labels(name_list);
        demo(cfg, weights, thresh, cam_index, filename, names, classes, frame_skip, prefix, hier_thresh);
    }
}
。。。。 未完待續