製作自己的yolo2資料集進行訓練

阿新 • • 發佈：2019-01-01

說明

本文承接上一篇修改yolo2相關配置的部落格，用來說明如何製作自己的訓練資料，。主要流程就是手動標註目標資訊了，當然，圖片首先要自己準備好。
注意：本文的識別型別只有1類

工具

- 畫框程式 https://github.com/puzzledqs/BBox-Label-Tool
- 格式轉換程式https://github.com/Guanghan/darknet?files=1 ——主要是用這裡的scripts/convert.py 轉換格式

畫框程式介紹

首先將該程式下載並解壓，會得到一個BBox-Label-Tool-master的資料夾，裡面還有Examples,Images,Labels三個資料夾。

將自己的圖片整合成一個資料夾，然後命名為002(003,004)這種形式，拷貝進Examples和Images裡。(不知道為啥要同時拷到兩個資料夾中，反正我拷到一箇中用不了）

通過命令列進入該資料夾,輸入:

python main.py

可以得到如下畫面：

這裡寫圖片描述

在image Dir的框中輸入2(3,4)，就是你拷進去的資料夾名。然後就會顯示影象了，此時就可以開始慢慢的標記了，每標完一張圖要點選“next>>”才會儲存，txt儲存在labels資料夾下。

這裡寫圖片描述

注意：該程式預設只能讀取.JPEG的檔案，如果你的圖片是.jpg是讀取不到的。解決方法：編輯main.py，用CTRL+F搜尋JPEG，在134行和152行左右修改“.JPEG”為“

.jpg”即可。

標記完成後進入labels資料夾，會出現對應的txt檔案，檔案內容類似如下：

2
112 73 155 154
205 128 277 154

第一行表示個數，第二行開始表示框的位置和大小。前兩個數表示框的左上角頂點，後兩個數表示框的長和寬。

現在我們就得到了圖片和相應的標記了，但是還不能開始訓練，因為要將標籤轉化為yolo所需要的格式。

格式轉化程式

首先將該程式下載並解壓，我們僅需用到scripts/convert.py。這裡要修改convert.py，我加中文註釋的地方是需要修改的。

# -*- coding: utf-8 -*-
"""
Created on Wed Dec  9 14:55:43 2015

This script is to convert the txt annotation files to appropriate format needed by YOLO 

@author: Guanghan Ning
Email:  
[email protected]
"""

import os
from os import walk, getcwd
from PIL import Image

classes = ["ship"]              #修改為自己的類別

def convert(size, box):
    dw = 1./size[0]
    dh = 1./size[1]
    x = (box[0] + box[1])/2.0
    y = (box[2] + box[3])/2.0
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x*dw
    w = w*dw
    y = y*dh
    h = h*dh
    return (x,y,w,h)


"""-------------------------------------------------------------------""" 

""" Configure Paths"""   
mypath = "/home/maqy/下載/BBox-Label-Tool-master/Labels/002/"   #修改為自己的原標籤所在地
outpath = "/home/maqy/下載/output/002/"   #轉化後的標籤儲存的地方，注意002這個資料夾也要存在

cls = "ship"    #修改為自己的類別
if cls not in classes:
    exit(0)
cls_id = classes.index(cls)

wd = getcwd()
list_file = open('%s/%s_list.txt'%(wd, cls), 'w')

""" Get input text file list """
txt_name_list = []
for (dirpath, dirnames, filenames) in walk(mypath):
    txt_name_list.extend(filenames)
    break
print(txt_name_list)

""" Process """
for txt_name in txt_name_list:
    # txt_file =  open("Labels/stop_sign/001.txt", "r")

    """ Open input text files """
    txt_path = mypath + txt_name
    print("Input:" + txt_path)
    txt_file = open(txt_path, "r")
    lines = txt_file.read().split('\n')   #for ubuntu, use "\r\n" instead of "\n"，這裡我用“\r\n”會報錯,根據情況修改

    """ Open output text files """
    txt_outpath = outpath + txt_name
    print("Output:" + txt_outpath)
    txt_outfile = open(txt_outpath, "w")


    """ Convert the data to YOLO format """
    ct = 0
    for line in lines:
        print('lenth of line is: ')
        print(len(line))
        print('\n')
        if(len(line) >= 2):
            ct = ct + 1
            print(line + "\n")
            elems = line.split(' ')
            print(elems)
            xmin = elems[0]
            xmax = elems[2]
            ymin = elems[1]
            ymax = elems[3]
            #
            img_path = str('%s/images/%s/%s.jpg'%(wd, cls, os.path.splitext(txt_name)[0])) #這裡是訓練圖片路徑，
#可以做相應的修改或者把訓練圖片拷貝過來，
#注意與原版yolo中的Images檔名首字母I的大小寫是不同的。 應該是通過這個路徑讀取圖片的長寬
        print("wd:"+wd+"cls"+cls+"os.path"+os.path.splitext(txt_name)[0])
            #t = magic.from_file(img_path)
            #wh= re.search('(\d+) x (\d+)', t).groups()
            print("wd:"+wd+" cls:"+cls+" os.path:"+os.path.splitext(txt_name)[0])
            im=Image.open(img_path)
            w= int(im.size[0])
            h= int(im.size[1])
            #w= 256
            #h= 256
            #w = int(xmax) - int(xmin)
            #h = int(ymax) - int(ymin)
            # print(xmin)
            print(w, h)
            b = (float(xmin), float(xmax), float(ymin), float(ymax))
            bb = convert((w,h), b)
            print(bb)
            txt_outfile.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')

    """ Save those images with bb into list"""
    if(ct != 0):
        list_file.write('%s/images/%s/%s.jpg\n'%(wd, cls, os.path.splitext(txt_name)[0]))

list_file.close()

然後在scripts/images/目錄下建立一個資料夾，名為程式碼段中修改過的cls的值。

cls = "ship"    #修改為自己的類別

(我的即是ship) 的資料夾，將之前進行過標註的圖片拷貝進去。然後在目錄下執行：

python convert.py

此時在你的輸出目錄下就有改好的txt檔案了。

準備訓練

回到自己的darknet目錄，進入scripts目錄，將圖片和標籤複製進來，並建立train.txt檔案。

這裡寫圖片描述

其中Images中儲存的是圖片，labels中儲存的是修改完後的標籤。train.txt中儲存訓練圖片的地址。

這裡寫圖片描述

不過建議採取Voc的形式，即在scripts中建立資料夾VOCdevkit/VOC2012/JPEGImages和VOCdevkit/VOC2012/labels，將圖片和標籤分別放入這兩個資料夾。此時train.txt文件為：

這裡寫圖片描述

開始訓練

首先下載一個預訓練的model（當然你也可以自己生成），放到darkent/目錄下。
下載地址 (76 MB)：http://pjreddie.com/media/files/darknet19_448.conv.23
然後執行指令：./darknet detector train cfg/voc.data cfg/yolo-voc.2.0.cfg darknet19_448.conv.23
指令中的yolo-voc.2.0.cfg 可以換成別的網路。就可以開始訓練了，迭代次數為設定的max_batches數。

測試結果

此時在backup目錄下會有很多.weights檔案，利用他們就可以進行檢測了。

./darknet detector test cfg/voc.data cfg/yolo-voc.2.0.cfg ./backup/yolo-voc_final.weights ./data/test/sar10.jpg

其中 cfg/yolo-voc.2.0.cfg替換成你所用的，./data/test/sar10.jpg是用來檢測的影象，修改為自己的路徑即可。

Mxnet(2)---faster-rcnn製作自己的資料集進行訓練

Mxnet自帶有faster-rcnn的例子，但是如果要用自己的資料進行訓練可能需要作一些更改，一個是類別的數目，一個數據的標籤。其實它的修改方式和py-faster-rcnn差不多。 **

製作自己的yolo2資料集進行訓練

說明本文承接上一篇修改yolo2相關配置的部落格，用來說明如何製作自己的訓練資料，。主要流程就是手動標註目標資訊了，當然，圖片首先要自己準備好。注意：本文的識別型別只有1類工具 - 畫框程式 https://github.com/puzzledqs/BBox-Lab

FCN製作自己的資料集、訓練和測試 caffe

花了兩三週的時間，在導師的催促下，把FCN的全部流程走了一遍，期間走了很多彎路，現在記錄一下。系統環境：ubuntu 16.04LTS 一、資料集的製作注：我的資料集是仿照VOC資料集進行製作的 1.resize 資料集我的GPU視訊記憶體4G，跑過大的圖片帶不動，需要resize圖片大小，放幾

網上爬取圖片製作成資料集進行訓練

一、用pthon爬取圖片如圖：建立一個資料夾，下放每一類的資料夾（我的絕對路徑是：/home/user/dataset/）在每一個class下面，建立一個test.py檔案，用以爬取圖片 # coding=utf-8 """根據搜尋詞下載百度圖片"""

影象語義分割標註工具labelme製作自己的資料集用於mask-rcnn訓練

labelme（標註mask資料集用的） windows python2 pip install pyqt pip install labelme python3 pip install pyqt5 pip install labelm

Win10系統下一步一步教你實現MASK_RCNN訓練自己的資料集（使用labelme製作自己的資料集）及需要注意的大坑

一、Labelme的安裝二、製作自己的資料集 2.1 首先使用labelme標註如下樣式圖片（我的圖片是jpg格式） 2.2每個檔案生成一個對應的.json檔案。如下 2.3執行上面參考部落格最後給

Spark中元件Mllib的學習11之使用ALS對movieLens中一百萬條（1M）資料集進行訓練，並對輸入的新使用者資料進行電影推薦

1解釋 spark-1.5.2 資料集：http://grouplens.org/datasets/movielens/ 一百萬條（1M）資料劃分：將樣本評分表以key值切分成3個部分，分別用於訓練 (60%，並加入使用者評分), 校驗 (20

fast rcnn 訓練自己的資料集（訓練和檢測）

1.預訓練模型介紹首先在data目錄下，有兩個目錄就是之前在1中解壓好 fast_rcnn_models/imagenet_models/ fast_rcnn_model資料夾下面是作者用fast rcnn訓練好的三個網路,分別對應著小、中、大型網路，大家可

YOLOv2在自己的資料集上訓練以及測試

0.前言因為yolo的作者不斷更新自己的版本，讓人使用和修改起來很不方便。因此這裡儲存一個自己的版本，並記錄如何在自己的資料集上訓練正框檢測模型。 1.YOLOv2程式碼備份： 2.修改檔案： voc.data檔案：修改’classes’為待

SSD目標檢測(2)：如何製作自己的資料集（詳細說明附原始碼）

前言：因為要依賴上一章SSD目標檢測(1)：圖片+視訊版物體定位（附原始碼）來訓練預測自己的資料集，所以建立自己的資料集是一個複雜且避不開的步驟，以下給出了製作自己的資料集所要經過的簡單步驟，而後也有更詳細的說明奉上。 VOC2007資料集簡介；規定資料夾

SSD-Tensorflow：利用KITTI資料集進行訓練

【mxnet】製作自己的資料集

參考步驟 1 標記資料集與VOC資料集不同，mxnet需要的標記資料為圖片左上角及右下角，記作：xmin,ymin,xmax,ymaxxmin,ymin,xmax,ymax。將四個座標資料以百分比表示，便於影象改變大小時保持標記框的位置正確。即記作

TensorFlow Object Detection API教程——製作自己的資料集

""" Usage: # From tensorflow/models/ # Create train data: python generate_tfrecord.py --csv_input=data/train_labels.csv --output_path=train.record

caffe學習筆記（四）--製作自己的資料集train.txt和val.txt，生成LMDB檔案

在深度學習的實際應用中，我們經常用到的原始資料是圖片檔案，如jpg,png,tif等格式的，而且有可能圖片的大小還不一致。我今天嘗試製作一個自己的訓練資料集，主要步驟為： 1.用MATLAB截圖得到訓練集的圖片 2.生成標籤檔案列表，即生成 train.

模仿mnist資料集製作自己的資料集

#include "Image_to_BinaryData.h" int main() { Image2BinaryData IBD(28,28); //設定圖片大小(Height,Width) /*------------生成訓練集檔案--------------------

Windows10+YOLOv3實現檢測自己的資料集（1）——製作自己的資料集

本文將從以下三個方面介紹如何製作自己的資料集資料標註資料擴增將資料轉化為COCO的json格式參考資料一、資料標註在深度學習的目標檢測任務中，首先要使用訓練集進行模型訓練。訓練的資料集好壞決定了任務的上限。下面介紹兩種常用的影象目標檢測標註工具：Labelme和LabelI

使用tensorflow訓練自己的資料集（一）——製作資料集

使用tensorflow訓練自己的資料集—製作資料集想記錄一下自己製作訓練集並訓練的過、希望踩過的坑能幫助後面入坑的人。本次使用的訓練集的是kaggle中經典的貓狗大戰資料集（提取碼：ufz5）。因為本人筆記本配置很差還不是N卡所以把train的資料分成了訓練集和測試集並沒有使用

gluoncv 訓練自己的資料集，進行目標檢測

跑了一晚上的模型，實在佔GPU資源，這兩天已經有很多小朋友說我了。我選擇了其中一個引數。 https://github.com/dmlc/gluon-cv/blob/master/scripts/detection/faster_rcnn/train_faster_rcnn.py train_faster

yolo2修改配置檔案訓練自己的資料集

說明本文主要介紹用yolo2訓練自己的資料集時要修改的配置檔案。（自己也在摸索中，以後會慢慢修改）環境 - ubuntu 16.04 - cuda 8.0 - opencv 3.2 - darknet(17年7月) ps:安裝darknet的時候，並沒有帶著o

利用Darket 和YOLOV3訓練自己的資料集(製作VOC)

1. 配置Darknet 下載darknet原始碼：git clone https://github.com/pjreddie/darknet 進入darknet目錄： cd darknet 如果是cpu直接make,否則需要修改Makefile，設

製作自己的yolo2資料集進行訓練

說明

工具

畫框程式介紹

首先將該程式下載並解壓，會得到一個BBox-Label-Tool-master的資料夾，裡面還有Examples,Images,Labels三個資料夾。

將自己的圖片整合成一個資料夾，然後命名為002(003,004)這種形式，拷貝進Examples和Images裡。(不知道為啥要同時拷到兩個資料夾中，反正我拷到一箇中用不了）

可以得到如下畫面：

在image Dir的框中輸入2(3,4)，就是你拷進去的資料夾名。然後就會顯示影象了，此時就可以開始慢慢的標記了，每標完一張圖要點選“next>>”才會儲存，txt儲存在labels資料夾下。

注意：該程式預設只能讀取.JPEG的檔案，如果你的圖片是.jpg是讀取不到的。 解決方法：編輯main.py，用CTRL+F搜尋JPEG，在134行和152行左右修改“.JPEG”為“ .jpg”即可。

標記完成後進入labels資料夾，會出現對應的txt檔案，檔案內容類似如下：

第一行表示個數，第二行開始表示框的位置和大小。前兩個數表示框的左上角頂點，後兩個數表示框的長和寬。

現在我們就得到了圖片和相應的標記了，但是還不能開始訓練，因為要將標籤轉化為yolo所需要的格式。

格式轉化程式

首先將該程式下載並解壓，我們僅需用到scripts/convert.py。這裡要修改convert.py，我加中文註釋的地方是需要修改的。

然後在scripts/images/目錄下建立一個資料夾，名為程式碼段中修改過的cls的值。

(我的即是ship) 的資料夾，將之前進行過標註的圖片拷貝進去。然後在目錄下執行：

此時在你的輸出目錄下就有改好的txt檔案了。

準備訓練

回到自己的darknet目錄，進入scripts目錄，將圖片和標籤複製進來，並建立train.txt檔案。

其中Images中儲存的是圖片，labels中儲存的是修改完後的標籤。train.txt中儲存訓練圖片的地址。

不過建議採取Voc的形式，即在scripts中建立資料夾VOCdevkit/VOC2012/JPEGImages和VOCdevkit/VOC2012/labels，將圖片和標籤分別放入這兩個資料夾。此時train.txt文件為：

開始訓練

測試結果

相關推薦

注意：該程式預設只能讀取.JPEG的檔案，如果你的圖片是.jpg是讀取不到的。解決方法：編輯main.py，用CTRL+F搜尋JPEG，在134行和152行左右修改“.JPEG”為“

.jpg”即可。