YOLO教程之訓練自己的資料

阿新 • • 發佈：2019-01-24

以上都是V2，V2比V1佔視訊記憶體少，訓練更快，指標更好，論文還沒有出來，程式碼裡面也有V1的相關檔案可以直接用。官網的教程寫得挺好，首先要仔細看了再看其他教程。

教程：目前所有的教程都是針對V1的

YOLO的安裝：yolo的安裝相對於caffe等環境非常簡便，主要按照官網上去做http://pjreddie.com/darknet/install/
資料格式轉換：

1）每張圖片一個annotation，所有訓練圖片一個路徑list。

2）annotation檔案：資料要轉換成darknet格式，作者提供了對voc資料的轉換，但是別的資料就需要自己寫指令碼了，不建議用convert.py

的指令碼

轉換演算法：

座標格式為：label x y w h

其中label為標籤，x ，y為box的中心座標/圖片的寬度，高度。同理w，h為box的寬度和高度/圖片的寬度，高度，資料不用截斷。label標籤這裡需要特別注意，前面教程3）裡這部分是有問題的。類標應該是從0開始，如果一類就是0，不用和資料夾名稱對應，需要的是labels的.png檔名稱和放圖片的資料夾以及放annotation的資料夾名稱對應。另外，教程中沒有提到annotation生成之後放在哪裡，事實上路徑是預設在train.txt的路徑其中的JPEGImages改成labels，路徑的其餘部分不變。

若用ning的convert.py

的程式碼中，需要修改類別以適應不同類別的label

""" Configure Paths"""

mypath = "labels/stopsign_original/" # 改

outpath = "labels/stopsign/" #改

cls = "stopsign" # 改

if cls not in classes:

    exit(0)

cls_id = classes.index(cls) # 本來就是對的，NGY教程改得不對

wd = getcwd()

list_file = open('%s/%s_list.txt'%(wd, cls), 'w') # 儲存圖片絕對位置資訊

注意：

（1）原座標資訊檔案每行結束不能只是換行，還要空格再換行才能與下一行分割開

（2）不過convert.py檔案本身資料部分是對的，但是讀寫檔案部分寫的難以看懂，我跑出來出來的結果也不對

3）生成標籤檔案：無論是作者的程式碼還是ning改的make_labels.py都不能成功，出來sh: 1: convert: not found，解決方法：直接在終端輸入python make_labels.py，顯示>之後沒了反應，中斷它，因為這說明是這個命令有問題，輸入convert（命令出錯時可以直接試一試在終端輸入，可能是沒有安裝這個命令），會顯示包含在哪個包裡，下載它！再執行make_labels.py,顯示：convert.im6: unable to read font `futura-normal' @ warning/annotate.c/RenderType/853.是因為沒有這個字型，在/usr/share/fonts/truetype/裡的確找不到，所以隨便改成一個系統自帶的字型就好，注意用全路徑(如*.ttc,*.ttf)，比如：-font /usr/share/fonts/truetype/arphic/ukai.ttc，如果labels包含有中文，則需新增utf-8編碼

in a word,在ubunbut下生成標籤名的圖片時，即文字轉圖片，報錯, convert : unable to read font

指令碼：make_label.py

成功範本：

# -*- coding: utf-8 -*-

import os

l=["rabbit", "fish", "deer", "tiger", "cat", "兔子"]

for word in l:

os.system("convert -fill black -background white -bordercolor white -border 4 -font /usr/share/fonts/truetype/arphic/ukai.ttc -pointsize 18 label:\"%s\" \"%s.png\""%(word, word))

3.修改程式碼：

1）yolo_kernel.cu

行62：draw_detections(det, l.side*l.side*l.n, demo_thresh, boxes, probs, voc_names, voc_labels, CLS_NUM);

2）yolo.c

行13：char *voc_names[] = {"text"};#改成自己的標籤名

行17：char *train_images = "/media/zqh/_E/darknet2/scripts/train.txt";#改成自己的train.txt清單所在路徑

    char *backup_directory = "/media/zqh/_E/darknet2/backup";#改成自己的訓練出來的權重檔案儲存路徑

行322：draw_detections(im, l.side*l.side*l.n, thresh, boxes, probs, voc_names, voc_labels, CLASSNUM);

倒數第2行：else if(0==strcmp(argv[2], "demo")) demo(cfg, weights, thresh, cam_index, filename, voc_names, 1, frame_skip, prefix);#1改成自己的類別數

3）yolo_train.cfg

改class和output，當num=3,和論文中B=2不同，output要按num計算，output=（num*5+class)*49

4.其他訓練步驟按照官網教程，訓練時.cfg檔案和初始權重要匹配：

yolo.cfg -> extraction.conv.weights

yolo-small.cfg -> strided.conv.weights

yolo-tiny.cfg -> darknet.conv.weights

yolo中用到的pre-trained weights的格式是.conv.weights的檔案，根據不同的model，要對已有的weights進行轉換。

./darknet partial cfg/extraction.cfg path/to/extraction.weights extraction.conv.weights # ./darknet partial 轉化網路現有weights的路徑需要生成的weights的路徑

yolo_v2 cfg檔案和對應的weights檔案字首一致，兩個版本的weight不通用

./darknet partial cfg/darknet.cfg path/to/darknet.weights path/to/darknet.conv.weights

YOLO教程之訓練自己的資料

以上都是V2，V2比V1佔視訊記憶體少，訓練更快，指標更好，論文還沒有出來，程式碼裡面也有V1的相關檔案可以直接用。官網的教程寫得挺好，首先要仔細看了再看其他教程。教程：目前所有的教程都是針對V1的 YOLO的安裝：yolo的安裝相對於caffe等環境非常簡便，主要

【YOLO初探】之 keras-yolov3訓練自己資料集

寫在前面如何使用官方資料集參看上一篇文章《【YOLO初探】之使用官方資料集做目標分類》傳送門：https://blog.csdn.net/plSong_CSDN/article/details/85108256 這裡，筆者使用了260張訓練資料，完成了人臉中“眼睛”、“鼻子”、“嘴

YOLO v3 安裝並訓練自己資料

1. 安裝 YOLO v3的安裝與YOLO v2的安裝方法一樣 git clone https://github.com/pjreddie/darknet 直接使用上邊的命令下載YOLO安裝包。下載完以後，開啟進入到安裝包路徑內 cd darkn

【計算機視覺】【神經網路與深度學習】YOLO v2 detection訓練自己的資料

轉自：http://blog.csdn.net/hysteric314/article/details/54097845 說明這篇文章是訓練YOLO v2過程中的經驗總結，我使用YOLO v2訓練一組自己的資料，訓練後的model，在閾值為.25的情況下，Reca

YOLO訓練自己資料集配置檔案修改.md

VOC2016 最早1093張personVOC2017 劉堯792張personVOC2018 恩德792張person_handVOC2019 person_head_hand(hand/hand1) 但是可以不生成hand1的labelVOC2020 person_head_hand size=224*

yolo v2 訓練自己資料集遇到的問題

1.CUDA Error: out of memory darknet: ./src/cuda.c:36: check_error: Assertio `0' failed. 需要修改所使用的模型cfg檔案中的subdivision的引數。由subdivisions=

Yolo V2訓練自己資料集

在參照了很多其他的部落格，成功訓練了自己的資料集，這裡記錄一下防止忘記便於以後總結學習。 VOC資料集準備準備資料首先準備好自己的資料集，最好固定格式，此處以VOC為例，採用jpg格式的影象，在名字上最好使用像VOC一樣類似I000001.jpg、I000002.j

使用pytorch版faster-rcnn訓練自己資料集

使用pytorch版faster-rcnn訓練自己資料集引言 faster-rcnn pytorch程式碼下載訓練自己資料集接下來工作參考文獻引言最近在復現目標檢測程式碼（師兄強烈推薦F

Python極簡教程之七：資料格式化（format）

自 python 2.6 開始，新增了一種格式化字串的函式str.format()，可謂威力十足。那麼，他跟之前的%型格式化字串相比，有什麼優越的存在呢？讓我們來揭開它羞答答的面紗。 #語法它通過{}和:來代替%。位置 '{0},{1}'.format('kzc',18) # k

《錯誤手記-01》 facenet使用預訓練模型fine-tune重新訓練自己資料集報錯

環境資訊：windows10+python3.5+tensorflow1.6.0 問題描述：在自己的訓練集上跑train_softmax.py. 引數： --logs_base_dir F:/work/runspace/log/ --models_base_

Kaldi中thchs30訓練自己資料集的步驟

一、資料準備過程網上下載的thchs-openslr資料集需要換成自己的資料集，包含兩個資料夾：data_thchs30和resource。下面講解如何搞定這一部分。資料集在data_thchs30檔案中，包含四個部分（data、train、dev、test）。 data資料夾中包

yolov3訓練自己資料集可參考文章

參考部落格原址： https://blog.csdn.net/u012966194/article/details/80004647 這篇文章將介紹編譯darknet框架開始，到整理資料集，到用yolo網路實現一個內部資料集中號碼簿的定

Yolov3訓練自己資料集+資料分析

訓練自己到資料集已經在上一篇文中說明過了，這一篇著重記錄一下資料分析過程資料分析 1. mAP值計算 1)訓練完成後，執行darknet官方程式碼中到 detector valid 命令，生成對測試集到檢測結果，命令如下： ./darknet detector va

YOLOv2目標檢測_單目標_訓練自己資料全過程（自用）

1. 製作符合要求的VOC資料集目標：製作如下格式的資料夾格式： --VOC2017（大寫字母+數字） --Annotations（存放儲存標註資訊的xml） --ImageSets --Main（存放儲存圖片名的train.txttest.txt） --Layo

Fast RCNN 訓練自己資料集 (1編譯配置)

FastRCNN 訓練自己資料集 (1編譯配置) FastRCNN是Ross Girshick在RCNN的基礎上增加了Multi task training整個的訓練過程和測試過程比RCNN快了許多。別的一些細節不展開，過幾天會上傳Fast RCNN的論文筆記。FastRCNN mAP效能上略有上升。Fa

YOLOv3在訓練自己資料集時的速度慢問題

YOLOv3以速度快著稱，但是在訓練自己的資料集時發現儘管在命令中同時開啟了多塊gpu，但速度仍舊很慢。按照其他人的訓練日誌可以看出64batch的單gpu訓練，每次迭代大約需要不到1秒但是自己在訓練時卻需要好幾個小時，首先想到的是自己的資料集是否圖片解析度太高，比較之後發現

FCN訓練自己資料集（person-segmentation）、SIFT-FLOW、SBD和VOC實驗總結

最近花了將近一週的時間，基於提供的原始碼，通過參考網上的部落格，跑通了FCN在三個資料集上的訓練以及測試。在這裡寫下總結，即是記錄，又希望能夠對其他剛剛接觸FCN的人有所幫助。 FCN的原始碼地址：https://github.com/shelhamer/fcn.berkeleyvision.o

windows10+GPU下caffe資料集Lmdb格式製作+訓練自己資料集

最近做人臉識別專案，想用到caffe訓練自己的資料，電腦作業系統為win10+GPU,這裡對caffe-windows配置、資料集製作、訓練資料都做一些介紹。（無GPU配置的看我這個部落格）。如果你用的是vs2015，那麼下面介紹的caffe不適合，要用BVLC wind

TensorFlow入門之訓練mnist資料集

import sys,os import numpy as np import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data mnist = input_data.

如何利用caffe訓練自己資料集

這篇博文主要參考了另一位博主https://blog.csdn.net/hellohaibo，在此向他表示感謝首先，博主今天的caffe崩了，毫無徵兆的崩了，具體表現為博主想做一個更大的資料集，但是在生成lmbd檔案時永遠生成的是一個沒有名字的資料夾，可是博主已經在指定的example目錄裡寫了

YOLO教程之訓練自己的資料

相關推薦