gluoncv 目標檢測，訓練自己的資料集

阿新 • • 發佈：2018-12-25

https://gluon-cv.mxnet.io/build/examples_datasets/detection_custom.html

官方提供兩種方案，一種是lst檔案，一種是xml檔案（voc的格式）；

voc 格式的標註有標註工具，但是你如果是json檔案標註的資訊，或者其他格式的，你就要轉成voc格式的。

於是就選擇第一種資料格式lst序列檔案格式，格式很簡單。

根據你自己的json或者其他格式檔案轉換一下。

import json
import os
import cv2
import numpy as np


def write_line(img_path, im_shape, boxes, ids, idx):
    h, w, c  
= im_shape
    # for header, we use minimal length 2, plus width and height
    # with A: 4, B: 5, C: width, D: height
    A = 4
    B = 5
    C = w
    D = h
    # concat id and bboxes
    labels = np.hstack((ids.reshape(-1, 1), boxes)).astype('float')
    # normalized bboxes (recommanded) 

    labels[:, (1, 3)] /= float(w)
    labels[:, (2, 4)] /= float(h)
    # flatten
    labels = labels.flatten().tolist()
    str_idx = [str(idx)]
    str_header = [str(x) for x in [A, B, C, D]]
    str_labels = [str(x) for x in labels]
    str_path = [img_path]
    line = '\t'.join(str_idx + str_header + str_labels + str_path) + ' 
\n'
    return line


files = os.listdir('train_front')
json_url = []
cnt = 0
for file in files:
    tmp = os.listdir('train_front/'+file)
    for js in tmp:
        if js.endswith('json'):
            json_url.append('train_front/'+file+'/'+js)
            cnt+=1
print(cnt)

fwtrain = open("train.lst","w")
fwval = open("val.lst","w")

first_flag = []
flag = True

cnt = 0
cnt1 = 0
cnt2 = 0
for json_url_index in json_url:
    file = open(json_url_index,'r')
    for line in file:
        js = json.loads(line)

        if 'person' in js:
            boxes = []
            ids = []
            for i in range(len(js['person'])):
                if js['person'][i]['attrs']['ignore'] == 'yes' or js['person'][i]['attrs']['occlusion']== 'heavily_occluded' or js['person'][i]['attrs']['occlusion']== 'invisible':
                    continue


                bbox = js['person'][i]['data']
                url = '/mnt/hdfs-data-4/data/jian.yin/'+json_url_index[:-5]+'/'+js['image_key']
                width = js['width']
                height = js['height']
                boxes.append(bbox)
                ids.append(0)

                print(url)
                print(bbox)

            if len(boxes) > 0:
                if flag:
                    flag = False
                    first_flag = boxes
                ids = np.array(ids)

                if cnt < 27853//2:

                    line = write_line(url,(height,width,3),boxes,ids,cnt1)
                    fwtrain.write(line)
                    cnt1+=1

                if cnt >= 27853//2:
                    line = write_line(url, (height, width, 3), boxes, ids, cnt2)
                    fwval.write(line)
                    cnt2+=1

                cnt += 1

fwtrain.close()
fwval.close()
print(first_flag)

lst檔案就轉換好了。

然後新增自己的資料集：

https://github.com/dmlc/gluon-cv/blob/master/scripts/detection/faster_rcnn/train_faster_rcnn.py#L73

這裡不能直接套用前面的匯入資料的過程。

按照教程給出的方式新增。投機取巧的驗證方式，直接引用前面的。

或者不驗證：https://github.com/dmlc/gluon-cv/blob/master/scripts/detection/faster_rcnn/train_faster_rcnn.py#L393 部分註釋掉。

    elif dataset.lower() == 'pedestrian':
        lst_dataset = LstDetection('train_val.lst',root=os.path.expanduser('.'))
        print(len(lst_dataset))
        first_img = lst_dataset[0][0]

        print(first_img.shape)
        print(lst_dataset[0][1])
        
        train_dataset = LstDetection('train.lst',root=os.path.expanduser('.'))
        val_dataset = LstDetection('val.lst',root=os.path.expanduser('.'))
        classs = ('pedestrian',)
        val_metric = VOC07MApMetric(iou_thresh=0.5,class_names=classs)

訓練引數：

https://github.com/dmlc/gluon-cv/blob/master/scripts/detection/faster_rcnn/train_faster_rcnn.py#L73

新增自己的訓練引數或者直接套用。

    if args.dataset == 'voc' or args.dataset == 'pedestrian':
        args.epochs = int(args.epochs) if args.epochs else 20
        args.lr_decay_epoch = args.lr_decay_epoch if args.lr_decay_epoch else '14,20'
        args.lr = float(args.lr) if args.lr else 0.001
        args.lr_warmup = args.lr_warmup if args.lr_warmup else -1
        args.wd = float(args.wd) if args.wd else 5e-4

model_zoo.py新增自己的資料集對映方案。這裡如果是pip install gluoncv ，就要到site-package裡面改。

https://github.com/dmlc/gluon-cv/blob/master/gluoncv/model_zoo/model_zoo.py#L32

'faster_rcnn_resnet50_v1b_pedestrian': faster_rcnn_resnet50_v1b_voc,

gluoncv 目標檢測，訓練自己的資料集

https://gluon-cv.mxnet.io/build/examples_datasets/detection_custom.html 官方提供兩種方案，一種是lst檔案，一種是xml檔案（voc的格式）； voc 格式的標註有標註工具，但是你如果是json檔案標註的資訊，或者其他格式的，你就要轉

使用pytorch版faster-rcnn訓練自己資料集

使用pytorch版faster-rcnn訓練自己資料集引言 faster-rcnn pytorch程式碼下載訓練自己資料集接下來工作參考文獻引言最近在復現目標檢測程式碼（師兄強烈推薦F

《錯誤手記-01》 facenet使用預訓練模型fine-tune重新訓練自己資料集報錯

環境資訊：windows10+python3.5+tensorflow1.6.0 問題描述：在自己的訓練集上跑train_softmax.py. 引數： --logs_base_dir F:/work/runspace/log/ --models_base_

Kaldi中thchs30訓練自己資料集的步驟

一、資料準備過程網上下載的thchs-openslr資料集需要換成自己的資料集，包含兩個資料夾：data_thchs30和resource。下面講解如何搞定這一部分。資料集在data_thchs30檔案中，包含四個部分（data、train、dev、test）。 data資料夾中包

SSD-Tensorflow 目標檢測（自定義資料集（VOC2007格式））

一、準備搭建SSD框架，下載解壓即可下載pascalvoc資料，自己的資料根據voc格式改寫（圖片的名稱，不用拘泥於6位數字，其他命名也可以）資料集下載點選解壓後不要混合在一個資料夾下 VOCtrainval用來訓練，VOCtest用來測試。 VOCtrai

yolov3訓練自己資料集可參考文章

參考部落格原址： https://blog.csdn.net/u012966194/article/details/80004647 這篇文章將介紹編譯darknet框架開始，到整理資料集，到用yolo網路實現一個內部資料集中號碼簿的定

Yolov3訓練自己資料集+資料分析

訓練自己到資料集已經在上一篇文中說明過了，這一篇著重記錄一下資料分析過程資料分析 1. mAP值計算 1)訓練完成後，執行darknet官方程式碼中到 detector valid 命令，生成對測試集到檢測結果，命令如下： ./darknet detector va

【YOLO初探】之 keras-yolov3訓練自己資料集

寫在前面如何使用官方資料集參看上一篇文章《【YOLO初探】之使用官方資料集做目標分類》傳送門：https://blog.csdn.net/plSong_CSDN/article/details/85108256 這裡，筆者使用了260張訓練資料，完成了人臉中“眼睛”、“鼻子”、“嘴

Fast RCNN 訓練自己資料集 (1編譯配置)

FastRCNN 訓練自己資料集 (1編譯配置) FastRCNN是Ross Girshick在RCNN的基礎上增加了Multi task training整個的訓練過程和測試過程比RCNN快了許多。別的一些細節不展開，過幾天會上傳Fast RCNN的論文筆記。FastRCNN mAP效能上略有上升。Fa

YOLOv3在訓練自己資料集時的速度慢問題

YOLOv3以速度快著稱，但是在訓練自己的資料集時發現儘管在命令中同時開啟了多塊gpu，但速度仍舊很慢。按照其他人的訓練日誌可以看出64batch的單gpu訓練，每次迭代大約需要不到1秒但是自己在訓練時卻需要好幾個小時，首先想到的是自己的資料集是否圖片解析度太高，比較之後發現

FCN訓練自己資料集（person-segmentation）、SIFT-FLOW、SBD和VOC實驗總結

最近花了將近一週的時間，基於提供的原始碼，通過參考網上的部落格，跑通了FCN在三個資料集上的訓練以及測試。在這裡寫下總結，即是記錄，又希望能夠對其他剛剛接觸FCN的人有所幫助。 FCN的原始碼地址：https://github.com/shelhamer/fcn.berkeleyvision.o

windows10+GPU下caffe資料集Lmdb格式製作+訓練自己資料集

最近做人臉識別專案，想用到caffe訓練自己的資料，電腦作業系統為win10+GPU,這裡對caffe-windows配置、資料集製作、訓練資料都做一些介紹。（無GPU配置的看我這個部落格）。如果你用的是vs2015，那麼下面介紹的caffe不適合，要用BVLC wind

如何利用caffe訓練自己資料集

這篇博文主要參考了另一位博主https://blog.csdn.net/hellohaibo，在此向他表示感謝首先，博主今天的caffe崩了，毫無徵兆的崩了，具體表現為博主想做一個更大的資料集，但是在生成lmbd檔案時永遠生成的是一個沒有名字的資料夾，可是博主已經在指定的example目錄裡寫了

Faster-RCNN 訓練自己資料集的坑記錄

主要照這篇部落格進行訓練配置，因為沒有GPU所以好多坑，CPU訓練可以參見這篇部落格正所謂，跑通了的都一樣，錯誤千萬樣。按照教程來也是坑多訓練： python train_faster_rcnn_alt_opt.py --net_name ZF --weights

FastRCNN 訓練自己資料集（二）——修改讀寫介面

這裡樓主講解了如何修改Fast RCNN訓練自己的資料集，首先請確保你已經安裝好了Fast RCNN的環境，具體的編配編制操作請參考我的上一篇文章。首先可以看到fast rcnn的工程目錄下有個Lib目錄這裡下面存在3個目錄分別是：datasetsfast_rcnnroi_d

FastRCNN 訓練自己資料集（一）——編譯配置

FastRCNN是Ross Girshick在RCNN的基礎上增加了Multi task training整個的訓練過程和測試過程比RCNN快了許多。別的一些細節不展開，過幾天會上傳Fast RCNN的論文筆記。FastRCNN mAP效能上略有上升。Fast RCNN中，提取OP的過程和訓練過程仍

py-faster-rcnn訓練自己資料集需要修改的引數

faster rcnn預設有三種網路模型ZF（小）、VGG_CNN_M_1024（中）、VGG16 （大）訓練圖片大小為500*500，類別數1。修改VGG_CNN_M_1024模型配置

Fast RCNN 訓練自己資料集 (2修改資料讀取介面)

Fast RCNN訓練自己的資料集（2修改讀寫介面）這裡樓主講解了如何修改Fast RCNN訓練自己的資料集，首先請確保你已經安裝好了Fast RCNN的環境，具體的編配編制操作請參考我的上一篇文章。首先可以看到fast rcnn的工程目錄下有個Lib目錄這裡下面存在3個目錄分別是： datase

YOLO訓練自己資料集配置檔案修改.md

VOC2016 最早1093張personVOC2017 劉堯792張personVOC2018 恩德792張person_handVOC2019 person_head_hand(hand/hand1) 但是可以不生成hand1的labelVOC2020 person_head_hand size=224*

yolo v2 訓練自己資料集遇到的問題

1.CUDA Error: out of memory darknet: ./src/cuda.c:36: check_error: Assertio `0' failed. 需要修改所使用的模型cfg檔案中的subdivision的引數。由subdivisions=

gluoncv 目標檢測，訓練自己的資料集

相關推薦