VOC資料集用於製作tensorflow所需格式

阿新 • • 發佈：2018-11-10

VOC資料集

VOC主要有三個重要的資料夾：Annotations、ImageSets和JPEGImages。分別是標註資訊、分割資訊和原始圖片等。
公開資料集有現成的對應檔案，前人已經做好標註工作。
在初步訓練網路時，選擇該組比較完備的資料，確實是一個比較快捷的方法。

XML到CSV格式

以下是一個標準的VOC格式寫法，貼上了一個VOCtrainval_11-May-2012資料夾下的XML格式檔案。

在這裡插入圖片描述

可以看到，除了基本尺寸，目標所在位置之外，還有part等資訊，可能是用於目標特徵級聯。
我們暫時不需要，直接的XML轉CSV格式會報錯，因為存在多個xmin等資料。

以下是修改後的用於VOC格式資料集的XML轉CSV的程式碼，主要修改部分在物體所在位置的資料讀取，我在原始碼上做了修改，這部分在Python可執行。

'''
import os
import glob
import pandas as pd
import xml.etree.ElementTree as ET

os.chdir('D:\\python_objectdetection\\models-master\\models-master\\research\\object_detection\\images_voc\\test')
path = 'D:\\python_objectdetection\\models-master\\models-master\\research\\object_detection\\images_voc\\test'

def xml_to_csv(path):
xml_list = []
for xml_file in glob.glob(path + '/*.xml'):
tree = ET.parse(xml_file)
root = tree.getroot()
for member in root.findall('object'):
value = (root.find('filename').text,
int(root.find('size')[0].text),
int(root.find('size')[1].text),
member[0].text,
# 原始碼長這樣，[4][0]大概意思：第4個節點的幾個成員；從0
# int(member[4][0].text),
# int(member[4][1].text),
# int(member[4][2].text),
# int(member[4][3].text),
#
# 因為是節點，所以這樣的形式訪問
int(member.find('bndbox')[0].text),
int(member.find('bndbox')[1].text),
int(member.find('bndbox')[2].text),
int(member.find('bndbox')[3].text),
)
xml_list.append(value)
print(value[3])
column_name = ['filename', 'width', 'height', 'class', 'xmin', 'ymin', 'xmax', 'ymax']

xml_df = pd.DataFrame(xml_list, columns=column_name)
return xml_df

def main():
image_path = path
xml_df = xml_to_csv(image_path)
xml_df.to_csv('test.csv', index=None)
print('Successfully converted xml to csv.')

main()

樣本類別統計

畢竟公開資料集，類別是先前標記，在初步手寫各個類別時候，存在漏寫情形，也會導致報錯。
以下檔案用於統計CSV檔案中所有的類別，C++寫的。

//統計CSV格式資料集中所有被包含的物體類別

#include<fstream>
#include<map>
#include<string>
#include<vector>
#include<iostream>
using namespace std;
#include<sstream>        //istringstream 必須包含這個標頭檔案

int main()
{
	ifstream fin("D:\\python_objectdetection\\models-master\\models-master\\research\\object_detection\\data\\test_voc.csv"); //開啟檔案流操作

	string line;
	
	vector<string>classes;
	
	while (getline(fin, line))   //整行讀取，換行符“\n”區分，遇到檔案尾標誌eof終止讀取
	{
		istringstream stream_in(line); //將整行字串line讀入到字串流istringstream中

		vector<string> fields; //宣告一個字串向量

		string field;

		while (getline(stream_in, field, ',')) //將字串流sin中的字元讀入到field字串中，以逗號為分隔符
		{
			fields.push_back(field); //將剛剛讀取的字串新增到向量fields中
		}

		vector<string>::iterator iter_class = find(classes.begin(), classes.end(), fields[3]);
		if (iter_class == classes.end())
		{
			classes.push_back(fields[3]);
		}
	}

	fin.close();
	
//把各類別寫在另一個CSV格式檔案

	ofstream file("D:\\python_objectdetection\\models-master\\models-master\\research\\object_detection\\data\\test_voc_classes.csv");

	for (int i = 1; i < classes.size(); i++)
	{
		file << classes[i] << endl;
	}
}

在統計完類別後，csv到tfrecord格式轉換，在類別宣告部分修改後，即可執行。
當然，也有比較工具化的，csv檔案右鍵點選篩選即可：

在這裡插入圖片描述

tensorflow下pbtxt檔案

訓練時候，資料集的配置流程：

新建圖片所在資料夾，儲存對應的train和test圖片；
新建data資料夾，存放CSV檔案和生成的record格式，以及類別宣告檔案，也就是那個pbtxt格式的檔案；
新建train資料夾，存放配置環境，也就是那個類似ssd_mobilenet_v1_coco.config的檔案，訓練過程中，模型可以在此資料夾下儲存。

如果你也恰好在用這組公開資料集，那偷個懶直接copy都可以的，我這邊生成的相應pbtxt格式檔案在此：

//該組資料對應pbtxt格式檔案

item {
name: "person"
id: 1
display_name: "person"
}

item {
name: "aeroplane"
id: 2
display_name: "aeroplane"
}

item {
name: "tvmonitor"
id: 3
display_name: "tvmonitor"
}

item {
name: "train"
id: 4
display_name: "train"
}

item {
name: "boat"
id: 5
display_name: "boat"
}

item {
name: "dog"
id: 6
display_name: "dog"
}

item {
name: "chair"
id: 7
display_name: "chair"
}

item {
name: "bird"
id: 8
display_name: "bird"
}

item {
name: "bicycle"
id: 9
display_name: "bicycle"
}

item {
name: "bottle"
id: 10
display_name: "bottle"
}

item {
name: "sheep"
id: 11
display_name: "sheep"
}

item {
name: "diningtable"
id: 12
display_name: "diningtable"
}

item {
name: "horse"
id: 13
display_name: "horse"
}

item {
name: "motorbike"
id: 14
display_name: "motorbike"
}

item {
name: "sofa"
id: 15
display_name: "sofa"
}

item {
name: "cow"
id: 16
display_name: "cow"
}

item {
name: "car"
id: 17
display_name: "car"
}

item {
name: "cat"
id: 18
display_name: "cat"
}

item {
name: "bus"
id: 19
display_name: "bus"
}

item {
name: "pottedplant"
id: 20
display_name: "pottedplant"
}

一切資料準備OK，等待訓練模型吧。

VOC資料集用於製作tensorflow所需格式

VOC資料集 VOC主要有三個重要的資料夾：Annotations、ImageSets和JPEGImages。分別是標註資訊、分割資訊和原始圖片等。公開資料集有現成的對應檔案，前人已經做好標註工作。在初步訓練網路時，選擇該組比較完備的資料，確實是一個比較快捷的方法。 XML到CS

【TensorFlow】TFRecord資料集的製作：讀取、顯示及程式碼詳解

在跑通了官網的mnist和cifar10資料之後，筆者嘗試著製作自己的資料集，並儲存，讀入，顯示。 TensorFlow可以支援cifar10的資料格式，也提供了標準的TFRecord 格式。 tensorflow 讀取資料，官網提供了以下三種方法： 1 Feeding：在

使用labelImg影象標註工具製作VOC資料集

1.Linux下安裝brew install qt qt4brew install libxml2make qt4py2pythobelImg.py2.windows下安裝安裝安裝Anaconda2-4

影象語義分割標註工具labelme製作自己的資料集用於mask-rcnn訓練

labelme（標註mask資料集用的） windows python2 pip install pyqt pip install labelme python3 pip install pyqt5 pip install labelm

製作VOC2007格式資料集用於Faster-RCNN訓練

轉自http://blog.csdn.net/sinat_30071459/article/details/50723212，自己加入了自己製作資料集時遇到的一些問題，和想法首先錄一段想製作成資料集的目標的視訊，截成一幀一幀的圖片，作為資料集的原材料。 0.資料夾

【Detection】物體識別-製作PASCAL VOC資料集

程式碼下載：github PASCAL VOC資料集 PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集，從2005年到2012年每年都會舉行一場影象識別challenge 預設為20類物體 1 資料集結構 ①JPEGImages JPEGImages資料夾中包含了PASCAL

VOC資料集顏色對應關係與程式碼

VOC顏色和分類的對於關係: code: def voc_colormap(N=256): def bitget(val, idx): return ((val & (1 << idx)) != 0)

PACAL VOC資料集格式的相關問題

獲取指定畫素值的座標 image_path = 'C:\\Users\\Yeh Chih-En\\Desktop\\test_images\\0bb0672f1afd6baaf94c516bcfb7dfae.png' image = Image.open(i

yolo 學習筆記分享之--VOC資料集

參考： <Pascal VOC & COCO資料集介紹 & 轉換> http://www.cnblogs.com/pprp/p/9629752.html 《Pascal Voc資料集詳細分析》https://blog.csdn.net/u01383270

配置FCN 8s voc資料集

按著博文http://blog.csdn.net/u012968002/article/details/78958090 的流程走的主要是各種路徑要搞清楚參見http://blog.csdn.net/supe_king/article/details/58121993 中間出現在

Deeplab_v2+VOC資料集

概述 Deeplab系列，是影象語意分割的經典之作，用深度學習的方法實現影象分割，繞不過系統學習Deeplab系列，而學習的最快途徑就是先把demo跑起來，之後再去細讀文獻和程式碼。本部落格主要是基於v2版本的deeplab,使用VGG16模型，在VOC201

ICnet基於VOC資料集的訓練

Voc4ICnet 資料集準備的目的:ICNET基於VOc資料集的訓練,和同時做分割和檢測的Blitznet做對比. 一、資料集標籤製作與準備: Pascal VOC資料集可用於目標檢測和分割,提供了語義分割標籤和例項分割標籤. 本文中使用的資料集為原始的pas

基於keras的YOLOv3在VOC資料集上訓練測試

一、編譯環境 windows7 Anaconda+python3.6+keras+tensroflow+pyCharm 二、步驟測試從上文第二個github上下載工程，並用

當python遇到h5py,h5py資料集的製作

製作可變大小的資料集h5檔案,可以參考下面的部落格連結: https://www.jishux.com/p/c11fa4f31d757d5c dset = f.create_dataset('mydata', shape=(1, 1,128,128), maxshape=(None,

Pascal Voc資料集詳細介紹

1.首先了解VOC2012資料集的內容資料集下載後解壓得到一個名為VOCdevkit的資料夾，該資料夾結構如下： . └── VOCdevkit #根目錄 └── VOC2012 #不同年份的資料集，這裡只下載了2012的，還有2007等其它年份的

VOC資料集顏色表

類別名稱 R G B background 0 0 0 背景 aeroplane 128 0 0 飛機 bicycle 0 128 0 bird 128 128 0 boat 0 0 128 bottle 128 0 128 瓶子 bus 0 128 128 大巴 car 128 1

VOC 資料集

可變形網路：https://github.com/msracver/Deformable-ConvNets VOC資料集： Test 引數 ('PascalVOC', '2007_test', './data', './data/VOCdevkit', './output/rcnn/voc/resne

No.3 ssd-caffe(2):訓練ssd-caffe模型：(以VOC資料集為例)

2.訓練ssd-caffe模型：(以VOC資料集為例) 使用caffe進行目標檢測，我們的需要標註了標籤的圖片作為訓練樣本，訓練模型。推薦使用開源的標註工具labelimg，來對我們的圖片進行標註。標註之後，會產生.xml檔案,用於標識圖片中物體的具體資訊。

VOC資料集mAP計算

檢測出來的bbox包含score和bbox，按照score降序排序，所以每新增一個樣本，就代表閾值降低一點（真實情況下score降低，iou不一定降低）。這樣就是可以有很多種閾值，每個閾值情況下計算一個prec和recall。 d:對模型檢測到的bbox迴圈：j:對該bbo

caffe資料集的製作有幾篇csdn上的博文還是蠻有用的。我總結了一下給大家連結上

深度學習caffe平臺--製作自己.lmdb格式資料集及分類標籤檔案 https://blog.csdn.net/guo1988kui/article/details/78356736 Caffe學習筆記3——製作並訓練自己的資料集 https://blog.csdn.net/hit20

VOC資料集用於製作tensorflow所需格式

VOC資料集

XML到CSV格式

樣本類別統計

tensorflow下pbtxt檔案

相關推薦