windows 下訓yolov3練自己的資料集

阿新 • • 發佈：2018-12-18

在win10下用yolov3訓練自己的資料集

轉載部落格原址： https://blog.csdn.net/congcong7267/article/details/82981084

1. 在darknet-master\build\darknet\x64 新建yolo-obj.cfg檔案（可以直接複製yolov3.cfg,然後重新命名為yolo-obj.cfg），

然後就是修改這個檔案內容了。

將batch 改成64 ：batch=64

將subdivisions 改成8 ：subdivisions=8

將每個yolo下（共有3處）的classes改成你自己的類的數量：classes = 1（我的是1類）

將每個yolo上面第一個convolutional下的filters改成你自己的大小，計算方法是： filters=(classes + 5)x3 ,由於我的是1類，所以我的filters=18. （和上面一樣，共有3處，3個yolo，每個yolo上面的第一個convolutional下的filters）每個yolo上面的第一個convolutional是網路的最後一個輸出層。

！！！注意注意：如果你對顯示卡較差（4G視訊記憶體以下），會出現記憶體溢位錯誤（Out of memory），改正方法：將batch改小些（64,32,16,8），將random改成0關閉多尺度訓練。

2.在build\darknet\x64\data\下新建obj.names檔案，裡面寫入你的類名，每個類名佔一行。

3.在build\darknet\x64\data\下新建obj.data檔案

把類別數改成你自己的數量。其他不變。

4.將你的所有樣本圖片放到：build\darknet\x64\data\obj\

5.將所有圖片對於的txt檔案也放到：build\darknet\x64\data\obj\

txt檔案格式如下

jpg圖片對應的txt可以用python指令碼生成（不過要先用圖片標註工具將目標圈出來，生成的是xml檔案），下面是標註工具的下載連結：

連結：https://pan.baidu.com/s/1Vq5A96iB2Mo0waguvQSa2Q 密碼：drlh

下面是將xml裝成txt的指令碼：


  
   
    
     
    
    
     
      import xml.etree.ElementTree as ET
     
    
   
    
     
    
    
     
      import pickle
     
    
   
    
     
    
    
     
      import os
     
    
   
    
     
    
    
     
      from os import listdir, getcwd
     
    
   
    
     
    
    
     
      from os.path import join
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      classes = ["bicycle"]  # 自行車檢測
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      def convert(size, box):
     
    
   
    
     
    
    
     
          dw = 1. / size[0]
     
    
   
    
     
    
    
     
          dh = 1. / size[1]
     
    
   
    
     
    
    
     
          x = (box[0] + box[1]) / 2.0
     
    
   
    
     
    
    
     
          y = (box[2] + box[3]) / 2.0
     
    
   
    
     
    
    
     
          w = box[1] - box[0]
     
    
   
    
     
    
    
     
          h = box[3] - box[2]
     
    
   
    
     
    
    
     
          x = x * dw
     
    
   
    
     
    
    
     
          w = w * dw
     
    
   
    
     
    
    
     
          y = y * dh
     
    
   
    
     
    
    
     
          h = h * dh
     
    
   
    
     
    
    
     
          return (x, y, w, h)
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      def convert_annotation(image_id):
     
    
   
    
     
    
    
     
          in_file = open('D:/darknet-master/scripts/VOCdevkit/voc/Annotations/%s.xml' % (image_id))
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
          out_file = open('D:/darknet-master/scripts/VOCdevkit/voc/labels/%s.txt' % (image_id), 'w')  # 生成txt格式檔案
     
    
   
    
     
    
    
     
          tree = ET.parse(in_file)
     
    
   
    
     
    
    
     
          root = tree.getroot()
     
    
   
    
     
    
    
     
          size = root.find('size')
     
    
   
    
     
    
    
     
          w = int(size.find('width').text)
     
    
   
    
     
    
    
     
          h = int(size.find('height').text)
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
          for obj in root.iter('object'):
     
    
   
    
     
    
    
     
              cls = obj.find('name').text
     
    
   
    
     
    
    
     
              if cls not in classes:
     
    
   
    
     
    
    
     
                  continue
     
    
   
    
     
    
    
     
              cls_id = classes.index(cls)
     
    
   
    
     
    
    
     
              xmlbox = obj.find('bndbox')
     
    
   
    
     
    
    
     
              b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
     
    
   
    
     
    
    
     
                   float(xmlbox.find('ymax').text))
     
    
   
    
     
    
    
     
              bb = convert((w, h), b)
     
    
   
    
     
    
    
     
              out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      image_ids_train = open('D:/darknet-master/scripts/VOCdevkit/voc/list.txt').read().strip().split('\',\'')  # list格式只有000000 000001
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      # image_ids_val = open('/home/*****/darknet/scripts/VOCdevkit/voc/list').read().strip().split()
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      list_file_train = open('boat_train.txt', 'w')
     
    
   
    
     
    
    
     
      list_file_val = open('boat_val.txt', 'w')
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      for image_id in image_ids_train:
     
    
   
    
     
    
    
     
          list_file_train.write('D:/darknet-master/scripts/VOCdevkit/voc/JPEGImages/%s.jpg\n' % (image_id))
     
    
   
    
     
    
    
     
          convert_annotation(image_id)
     
    
   
    
     
    
    
     
      list_file_train.close()  # 只生成訓練集，自己根據自己情況決定
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      # for image_id in image_ids_val:
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      #    list_file_val.write('/home/*****/darknet/boat_detect/images/%s.jpg\n'%(image_id))
     
    
   
    
     
    
    
     
      #    convert_annotation(image_id)
     
    
   
    
     
    
    
     
      # list_file_val.close()

5.在build\darknet\x64\data\下新建train.txt

將你的訓練圖片的路徑放入檔案，每行一個路徑，如下圖：

6.將darknet的預訓練權重放入build\darknet\x64，下面是我的網盤連結，我的網盤裡有：

連結：https://pan.baidu.com/s/1Gdo2gj1bggjUtW9CyYkIpQ 密碼：x5ht

7.修改網路配置檔案Makefile（在\darknet-master路徑下）

8.開啟win10終端，cd進入darknet-master\build\darknet\x64路徑，然後輸入：darknet.exe detector train data/obj.data yolo-obj.cfg darknet53.conv.74 開始訓練。

9.訓練時，每訓練100輪，都會生成一個權重檔案在build\darknet\x64\backup\ 下，檔名例如：yolo-obj_100.weights（後面的100是訓練100輪是的權重）。

10.測試訓練效果：

將那個backup檔案下最後一個權重檔案複製到build\darknet\x64\檔案下，開啟win10終端，cd進入然後執行darknet-master\build\darknet\x64路徑，然後輸入：darknet.exe detector test data/obj.data yolo-obj.cfg yolo-obj_100.weights（最後的權重改為你自己的權重）。終端會提醒你輸入圖片路徑，然後你輸入測試圖片的絕對路徑即可看到效果。

參考教程：https://github.com/AlexeyAB/darknet#how-to-compile-on-linux

在win10下用yolov3訓練自己的資料集

轉載部落格原址： https://blog.csdn.net/congcong7267/article/details/82981084

windows 下訓yolov3練自己的資料集

windows 下訓yolov3練自己的資料集

yolov3訓練自己資料集可參考文章

Yolov3訓練自己資料集+資料分析

【YOLO初探】之 keras-yolov3訓練自己資料集

win10 下的YOLOv3 訓練 wider_face 資料集檢測人臉

YOLOv3在訓練自己資料集時的速度慢問題

windows10+GPU下caffe資料集Lmdb格式製作+訓練自己資料集

Yolov3程式碼分析與訓練自己資料集

Centos，Windows 下簡單查看自己VPS使用的虛擬化技術是什麽

Windows下編譯Yolov3（CUDA9.1+cudnn7.0+OpenCV 3.1.0）

使用pytorch版faster-rcnn訓練自己資料集

《錯誤手記-01》 facenet使用預訓練模型fine-tune重新訓練自己資料集報錯

Kaldi中thchs30訓練自己資料集的步驟

基於keras的YOLOv3在VOC資料集上訓練測試

深度學習（tensorflow） —— 自己資料集讀取opencv

Fast RCNN 訓練自己資料集 (1編譯配置)

windows下，快速把某個資料夾下的檔名稱寫到另一個檔案裡（一般用在複製圖片檔名）

FCN訓練自己資料集（person-segmentation）、SIFT-FLOW、SBD和VOC實驗總結

如何利用caffe訓練自己資料集

Faster-RCNN 訓練自己資料集的坑記錄

windows 下訓yolov3練自己的資料集

相關推薦