Faster RCNN從demo到訓練自己的資料(3)——資料集製作篇

阿新 • • 發佈：2019-01-27

製作資料集可以選擇自己編寫一個demo，也可以直接下載labelImg進行標註。Faster RCNN需要的標註檔案為xml檔案。

我是自己編寫的一個demo，標記出每一張圖片的座標框和分類，生成的文字為txt檔案，也是常見的caffe標註規格，如下圖。

1.將txt檔案轉換為xml檔案。

建議將xml檔案儲存在.\py-faster-rcnn-master\data\VOCdevkit2007\VOC2007\路徑下，若沒有則新建。

# -*- coding:UTF-8 -*-
import os, sys
import glob
import cv2
from PIL import Image

src_img_dir = "D:/py-faster-rcnn-master/picture"

src_xml_dir = "D:/py-faster-rcnn-master/data/VOCdevkit2007/VOC2007/Annotations"

obj =[]
if os.path.exists(src_img_dir):
    list = os.listdir(src_img_dir)
    for i in range(len(list)):
        if 'txt' in list[i]:
            obj.append(list[i])


for i in range(len(obj)):
    pic = cv2.imread(src_img_dir+'/'+obj[i].strip('.txt')+'.jpg')
    size = pic.shape
    label = []
    with open(src_img_dir+'/'+obj[i],'r') as txt:
        info = true
        while info:
            info = txt.readline().strip()
            if "\x00" in info:
                label.append(info)
            elif " "  in info:
                label.append(info)

    txt.close()
    if label:
        xml_file = open((src_xml_dir + '/' + obj[i].strip('.txt') + '.xml'), 'w')
        xml_file.write('<annotation>\n')
        xml_file.write('    <folder>VOC2007</folder>\n')
        xml_file.write('    <filename>' + obj[i].strip('.txt')+'.jpg' + '</filename>\n')
        xml_file.write('    <size>\n')
        xml_file.write('        <width>' + str(size[1]) + '</width>\n')
        xml_file.write('        <height>' + str(size[0]) + '</height>\n')
        xml_file.write('        <depth>3</depth>\n')
        xml_file.write('    </size>\n')

        # write the region of image on xml file
        for img_each_label in label:
            spt = img_each_label.split('\x00')  # 這裡如果txt裡面是以逗號‘，’隔開的，那麼就改為spt = img_each_label.split(',')。
            if len(spt) == 1:
                spt = img_each_label.split(' ')
            if len(spt) == 1:
                break
            if int(spt[5]) == 0 or 1 or 2:
                la = 0
            if int(spt[5]) == 3 or 4 or 5:
                la = 1
                print("yes")
            xml_file.write('    <object>\n')
            xml_file.write('        <name>' + str(la) + '</name>\n')
            xml_file.write('        <pose>Unspecified</pose>\n')
            xml_file.write('        <truncated>0</truncated>\n')
            xml_file.write('        <difficult>0</difficult>\n')
            xml_file.write('        <bndbox>\n')
            xml_file.write('            <xmin>' + str(spt[1]) + '</xmin>\n')
            xml_file.write('            <ymin>' + str(spt[2]) + '</ymin>\n')
            xml_file.write('            <xmax>' + str(spt[3]) + '</xmax>\n')
            xml_file.write('            <ymax>' + str(spt[4]) + '</ymax>\n')
            xml_file.write('        </bndbox>\n')
            xml_file.write('    </object>\n')

        xml_file.write('</annotation>')
        xml_file.close()
    else:
        print(obj[i])

2.生成train和test檔案。

在.\py-faster-rcnn-master\data\VOCdevkit2007\VOC2007\ImageSets\Main路徑下生成test.txt，train.txt，trainval.txt，val.txt四個檔案。test.txt是測試集，取出的佔樣本總量的50％；train.txt是訓練集，佔25％；val.txt是驗證集，佔25%；trainval.txt是訓練和驗證集，佔50％。

import os
import random

trainval_percent = 0.66
train_percent = 0.5
xmlfilepath = 'D:/py-faster-rcnn-master/VOC2007_/Annotations'
txtsavepath = 'D:/py-faster-rcnn-master/VOC2007_/ImageSets/Main'
total_xml = os.listdir(xmlfilepath)

num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)

ftrainval = open('D:/py-faster-rcnn-master/VOC2007_/ImageSets/Main/trainval.txt', 'w')
ftest = open('D:/py-faster-rcnn-master/VOC2007_/ImageSets/Main/test.txt', 'w')
ftrain = open('D:/py-faster-rcnn-master/VOC2007_/ImageSets/Main/train.txt', 'w')
fval = open('D:/py-faster-rcnn-master/VOC2007_/ImageSets/Main/val.txt', 'w')

for i in list:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        ftrainval.write(name)
        if i in train:
            ftrain.write(name)
        else:
            fval.write(name)
    else:
        ftest.write(name)

ftrainval.close()
ftrain.close()
fval.close()
ftest.close()

3.將.jpg檔案放在JPEGImages資料夾下。

.\py-faster-rcnn-master\data\VOCdevkit2007\VOC2007路徑下有三個資料夾，Annotations、ImageSets和JPEGImages。

Faster RCNN從demo到訓練自己的資料(3)——資料集製作篇

製作資料集可以選擇自己編寫一個demo，也可以直接下載labelImg進行標註。Faster RCNN需要的標註檔案為xml檔案。我是自己編寫的一個demo，標記出每一張圖片的座標框和分類，生成的文字為txt檔案，也是常見的caffe標註規格，如下圖。 1.將txt

Faster RCNN從demo到訓練自己的資料(1)——前言篇

注意：一定要保證電腦裝有353.66（CUDA7.5）或369.30（CUDA8.0）以上的N卡驅動，至少保證使用GeForce800系列以上的顯示卡！否則caffe會顯示 “Check failed: error == cudaSuccess (35 vs. 0)”。

文章標題 faster rcnn-pytorch版訓練自己的資料

pytorch框架比起tenserflow和caffe等框架相對簡單很多，程式碼短小精悍，這裡記錄一下用pytorch版的faster rcnn訓練自己的資料並測試的過程，以及途中遇到的一些問題。一、github上下載faster rcnn pytorch的

請問下Faster rcnn 中最後訓練出自己的模型,得到的AP=0.00 mAP=0.000? 檢測精度為什麼是0呢?[已經解決,, TillTheWorldEnd 的回答可以解決哈]

大家好,本人最近在學習faster rcnn ,小白一枚,參考了很多教程。環境: ubuntu+cuda+python 執行結果: Saving cached annotations to /home/think/asuna/py-faster-rcnn/data/VOC

使用coco資料集，faster rcnn類方法訓練出錯解決

問題：在caffe框架下，使用coco資料集進行faster rcnn類方法訓練，得到如下錯誤： File "/data/zn/light_head_rcnn/script/py-RFCN-priv/tools/../lib/rpn/anchor_target_layer.

利用tensorflow訓練自己的圖片資料（3）——建立網路模型

一. 說明在上一部落格——利用tensorflow訓練自己的圖片資料（2）中，我們已經獲得了神經網路的訓練輸入資料：image_batch，label_batch。接下就是建立神經網路模型，筆者的網路模型結構如下：輸入資料：（batch_size，IMG_W，IMG_H

tensorflowxun訓練自己的數據集之從tfrecords讀取數據

str 兩個圖片文件 lines 註意 file ans span 數據集　　當訓練數據量較小時，采用直接讀取文件的方式，當訓練數據量非常大時，直接讀取文件的方式太耗內存，這時應采用高效的讀取方法，讀取tfrecords文件，這其實是一種二進制文件。tensorflow

Faster-RCNN-tf使用訓練好的模型驗證測試集 test_net.py

對應原始碼地址：https://github.com/endernewton/tf-faster-rcnn 1、開啟tools目錄下的test_net.py檔案修改（1）： parser.add_argument('--model', dest='model', help='mo

完整實現利用tensorflow訓練自己的圖片資料集

經過差不多一個禮拜的時間的學習，終於把完整的一個利用自己爬取的圖片做訓練資料集的卷積神經網路的實現（基於tensorflow）簡單整理一下思路：獲取資料集（上網爬取，或者直接找公開的圖片資料集） reshape圖片成相同大小（公開資料集一般都是相同sha

使用TensorFlow slim資料夾當中的inception_resnet_v2網路訓練自己的分類資料集

每個資料夾存放一種類別的圖片資料夾名稱即為類別名稱轉換資料集為TFRecords格式的檔案：進入下載以後的資料夾中/models/research/slim/，使用pycharm開啟slim資料夾，開啟轉換格式的檔案download_and_c

Yolov3訓練自己標記的資料

一、首先下載配置Yolov3框架 git clone https://github.com/pjreddie/darknet cd darknet make 下載常用的模型檔案 wget https://pjreddie.com/media/files/yolov3.weights wg

faster-rcnn配置和訓練小結

論文：http://arxiv.org/abs/1506.01497 1.準備工作類似於fast-rcnn http://blog.csdn.net/u010678153/article/details/46892911 2.安裝（用於demo） 2.1 從github

tensorflow實現FCN完成訓練自己標註的資料

一、先復現FCN 環境：Ubuntu18.04+tensorflow（我的） 1.下載程式碼：論文地址：https://arxiv.org/pdf/1605.06211v1.pdf 　　論文視訊地址：http://techtalks.tv/talks

Tensorflow + ResNet101 + fasterRcnn 訓練自己的模型資料（一）

一、資料準備： 1、PASCAL VOC資料集格式 2、資料擴充：做了旋轉【0， 90，180，270】（備註：這裡可以不做那麼多許旋轉，fasterrcnn在訓練的時候要做圖片的映象變換）、降取樣降取樣： import os import cv2 import nu

Faster rcnn 安裝、訓練、測試、除錯

先上個檢測效果：（1）圖片人臉檢測+關鍵點（2）攝像頭實時人臉+關鍵點 **********************************************************

利用tensorflow訓練自己的圖片資料（5）——測試訓練網路

一.說明上一篇部落格中，我們已經將建立好的網路模型訓練好了，並將訓練的網路引數儲存在相應的檔案中；下面我們就開始測試網路，驗證網路的訓練效果；本次測試為隨機的單圖片測試，即隨機的從訓練集或測試集中讀取一張圖片，送入到神經網路中進行識別，列印識別率及識別的影象。二. 程式

在Windows系統下，用faster-RCNN進行模型訓練

一、圖片標註程式1:（實用性不高）下載地址：參考網址：使用方法:程式碼已經封裝成DLL，你只需要開啟專案，將影象路徑修改成你的即可。（我用的VS為2013）。生成的txt內容為：影象名標籤 x1 y1 x2 y2。（包圍框座標）圖片顯示出來後，輸入法切換到英文；在目標的左上

caffe-ssd 訓練自己的VOC資料集(一):轉換VOC xml資料為lmdb格式

假設你已經做好了VOC資料標籤，也就是xml檔案，並且已經配置好了caffe-ssd的環境第一步，在caffe-ssd/data目錄下本身自帶有如下資料夾：然後在caffe-ssd/data目錄下新建一個資料夾命名為VOCdevkit: 然後data目錄下有：

Caffe:製作與訓練自己的圖片資料

一、製作資料根據上篇內容來製作資料。我用的是中草藥的資料，包括三種藥材； cheqianzi：700張 JianLianHua:1000張 pugongying:500張

利用tensorflow訓練自己的圖片資料集——資料準備

昨天實現了一個簡單的CNN網路。用了MNIST資料集，雖然看來對這個資料集用的很多，但是真正這個資料集是怎麼在訓練的時候被呼叫的，以及怎麼把它換成自己的資料集都是一臉懵。作者給的程式碼是python2.x版本的，我用的python3.5，改了一些錯誤。 import

Faster RCNN從demo到訓練自己的資料(3)——資料集製作篇

1.將txt檔案轉換為xml檔案。

2.生成train和test檔案。

3.將.jpg檔案放在JPEGImages資料夾下。

相關推薦