Pascal Voc資料集詳細分析
前言
做深度學習目標檢測方面的同學怎麼都會接觸到PASCAL VOC這個資料集。也許很少用到整個資料集,但是一般都會按照它的格式準備自己的資料集。所以這裡就來詳細的記錄一下PASCAL VOC的格式,包括目錄構成以及各個資料夾的內容格式,方便以後自己按照VOC的標準格式製作自己的資料集。
正文
相關網址
VOCdevkit資料夾
資料集下載後解壓得到一個名為VOCdevkit的資料夾,該資料夾結構如下:
.
└── VOCdevkit #根目錄
└── VOC2012 #不同年份的資料集,這裡只下載了2012的,還有2007等其它年份的
├── Annotations #存放xml檔案,與JPEGImages中的圖片一一對應,解釋圖片的內容等等
├── ImageSets #該目錄下存放的都是txt檔案,txt檔案中每一行包含一個圖片的名稱,末尾會加上±1表示正負樣本
│ ├── Action
│ ├── Layout
│ ├── Main
│ └── Segmentation
├── JPEGImages #存放源圖片
├── SegmentationClass #存放的是圖片,分割後的效果,見下文的例子
└── SegmentationObject #存放的是圖片,分割後的效果,見下文的例子
這裡大概介紹一下各個資料夾的內容,更細節的介紹將在後文給出:
- Annotation資料夾存放的是xml檔案,該檔案是對圖片的解釋,每張圖片都對於一個同名的xml檔案。
- ImageSets資料夾存放的是txt檔案,這些txt將資料集的圖片分成了各種集合。如Main下的train.txt中記錄的是用於訓練的圖片集合
- JPEGImages資料夾存放的是資料集的原圖片
- SegmentationClass以及SegmentationObject資料夾存放的都是圖片,且都是影象分割結果圖(樓主沒用過,所以不清楚)
Annotation資料夾
Annotation資料夾的內容如下:
其中xml主要介紹了對應圖片的基本資訊,如來自那個資料夾、檔名、來源、影象尺寸以及影象中包含哪些目標以及目標的資訊等等,內容如下:
<annotation>
<folder>VOC2012</folder> #表明圖片來源
<filename>2007_000027.jpg</filename> #圖片名稱
<source> #圖片來源相關資訊
<database>The VOC2007 Database</database>
<annotation>PASCAL VOC2007</annotation>
<image>flickr</image>
</source>
<size> #影象尺寸
<width>486</width>
<height>500</height>
<depth>3</depth>
</size>
<segmented>0</segmented> #是否用於分割
<object> #包含的物體
<name>person</name> #物體類別
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox> #物體的bbox
<xmin>174</xmin>
<ymin>101</ymin>
<xmax>349</xmax>
<ymax>351</ymax>
</bndbox>
<part> #物體的頭
<name>head</name>
<bndbox>
<xmin>169</xmin>
<ymin>104</ymin>
<xmax>209</xmax>
<ymax>146</ymax>
</bndbox>
</part>
<part> #物體的手
<name>hand</name>
<bndbox>
<xmin>278</xmin>
<ymin>210</ymin>
<xmax>297</xmax>
<ymax>233</ymax>
</bndbox>
</part>
<part>
<name>foot</name>
<bndbox>
<xmin>273</xmin>
<ymin>333</ymin>
<xmax>297</xmax>
<ymax>354</ymax>
</bndbox>
</part>
<part>
<name>foot</name>
<bndbox>
<xmin>319</xmin>
<ymin>307</ymin>
<xmax>340</xmax>
<ymax>326</ymax>
</bndbox>
</part>
</object>
</annotation>
ImageSets資料夾
ImageSets包含如下四個子資料夾:
各個資料夾中存放的是各種用途的TXT檔案。例如在Main資料夾下有名為aeroplane_train.txt的檔案,顧名思義是用於飛機類別的訓練資料。該txt的具體內容如下,其中±1應該表示的是正負樣本的含義(沒有具體研究):
2008_000008 -1
2008_000015 -1
2008_000019 -1
2008_000023 -1
2008_000028 -1
2008_000033 1
2008_000036 -1
2008_000037 1
2008_000041 -1
2008_000045 -1
其中包含的train.txt以及trainval.txt等檔案內容與上面類似。不過博主發現train.txt和trainval.txt內容中光有圖片的名字,末尾沒有標註正負1.
JEPGImages資料夾
該資料夾存放的是資料集的所有源圖片,內容如下:
SegmentationClass資料夾
還沒有涉及影象分割領域,不太清楚該資料夾下圖片的用處,截圖貼上來吧:
SegmentationObject資料夾
同上,把內容截圖上傳:
相關推薦
Pascal Voc資料集詳細分析
前言 做深度學習目標檢測方面的同學怎麼都會接觸到PASCAL VOC這個資料集。也許很少用到整個資料集,但是一般都會按照它的格式準備自己的資料集。所以這裡就來詳細的記錄一下PASCAL VOC的格式,包括目錄構成以及各個資料夾的內容格式,方便以後自己按照VOC
Pascal Voc資料集詳細介紹
1.首先了解VOC2012資料集的內容 資料集下載後解壓得到一個名為VOCdevkit的資料夾,該資料夾結構如下: . └── VOCdevkit #根目錄 └── VOC2012 #不同年份的資料集,這裡只下載了2012的,還有2007等其它年份的
【計算機視覺】PASCAL VOC資料集分析
<annotation> <folder>VOC2012</folder> <filename>2007_000392.jpg</filename>
PASCAL VOC資料集分析
接下來需要研究的是如何自己生成訓練資料和測試資料,將在下一篇中闡述。2. 轉載2 現在深度學習很多框架都在使用VOC資料集,來研究一下voc資料集的具體內容 一般voc解壓出來後都包括Annotations,ImageSets,JPEFImages,SegmentationClass ,Segmentatio
PASCAL VOC資料集分析(分類部分)
VOC2007資料集共包含:訓練集(5011幅),測試集(4952幅),共計9963幅圖,共包含20個種類。 資料集的組成架構如下: Annotations —目標真值區域ImageSets —-類別標籤JPEGImages —–影象SegmentationClassSegmentationObje
PASCAL VOC資料集分析(檢測部分)
Pascal VOC 資料集介紹介紹Pascal VOC資料集:Challenge and tasks, 只介紹Detection與Segmentation相關內容。資料格式 Dataset衡量方式 Evaluationvoc2007, voc2012Challenge
計算機視覺標準資料集整理—PASCAL VOC資料集
資料集下載 PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge。此資料集可以用於影象分類、目標檢測、影象分割。 資料集下載映象地址如下(包括VOC2007和VOC2012):
PASCAL VOC 資料集
PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge。 下載完之後解壓,可以在VOCdevkit目錄下的VOC20
PASCAL VOC資料集The PASCAL Object Recognition Database Collection
The PASCAL Object Recognition Database Collection News 04-Apr-07: The VOC2007 challenge development kit is now available.Objectives To
【Detection】物體識別-製作PASCAL VOC資料集
程式碼下載:github PASCAL VOC資料集 PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge 預設為20類物體 1 資料集結構 ①JPEGImages JPEGImages資料夾中包含了PASCAL
VOC資料集顏色對應關係與程式碼
VOC顏色和分類的對於關係: code: def voc_colormap(N=256): def bitget(val, idx): return ((val & (1 << idx)) != 0)
VOC資料集用於製作tensorflow所需格式
VOC資料集 VOC主要有三個重要的資料夾:Annotations、ImageSets和JPEGImages。分別是標註資訊、分割資訊和原始圖片等。 公開資料集有現成的對應檔案,前人已經做好標註工作。 在初步訓練網路時,選擇該組比較完備的資料,確實是一個比較快捷的方法。 XML到CS
CelebA資料集詳細屬性統計
CelebA是香港中文大學提供的包含10,177個名人身份的202,599張人臉圖片的資料集,其提供了5個點的人臉關鍵點座標以及40個屬性,可以在Large-scale CelebFaces Attributes (CelebA) Dataset下載. 各屬性的含義請參考文末給出的連結,本文的程
PACAL VOC資料集格式的相關問題
獲取指定畫素值的座標 image_path = 'C:\\Users\\Yeh Chih-En\\Desktop\\test_images\\0bb0672f1afd6baaf94c516bcfb7dfae.png' image = Image.open(i
yolo 學習筆記分享之--VOC資料集
參考: <Pascal VOC & COCO資料集介紹 & 轉換> http://www.cnblogs.com/pprp/p/9629752.html 《Pascal Voc資料集詳細分析》https://blog.csdn.net/u01383270
配置FCN 8s voc資料集
按著博文http://blog.csdn.net/u012968002/article/details/78958090 的流程走的 主要是各種路徑要搞清楚 參見http://blog.csdn.net/supe_king/article/details/58121993 中間出現在
Deeplab_v2+VOC資料集
概述 Deeplab系列,是影象語意分割的經典之作,用深度學習的方法實現影象分割,繞不過系統學習Deeplab系列,而學習的最快途徑就是先把demo跑起來,之後再去細讀文獻和程式碼。 本部落格主要是基於v2版本的deeplab,使用VGG16模型,在VOC201
ICnet基於VOC資料集的訓練
Voc4ICnet 資料集準備的目的:ICNET基於VOc資料集的訓練,和同時做分割和檢測的Blitznet做對比. 一、資料集標籤製作與準備: Pascal VOC資料集可用於目標檢測和分割,提供了語義分割標籤和例項分割標籤. 本文中使用的資料集為原始的pas
基於keras的YOLOv3在VOC資料集上訓練測試
一、編譯環境 windows7 Anaconda+python3.6+keras+tensroflow+pyCharm 二、步驟 測試 從上文第二個github上下載工程,並用
利用python對泰坦尼克號資料集進行分析
一、資料來源 資料集來自於Kaggle。Kaggle是一個數據分析建模的應用競賽平臺。當然也可以從其它地方下。 二、相關工具 2.1 Python 3.5.2 2.2 Anaconda 3 三、牛刀小試 3.1 匯入訓練資料集 import pandas as