Pascal Voc資料集詳細分析

阿新 • • 發佈：2019-01-21

前言

做深度學習目標檢測方面的同學怎麼都會接觸到PASCAL VOC這個資料集。也許很少用到整個資料集，但是一般都會按照它的格式準備自己的資料集。所以這裡就來詳細的記錄一下PASCAL VOC的格式，包括目錄構成以及各個資料夾的內容格式，方便以後自己按照VOC的標準格式製作自己的資料集。

正文

VOCdevkit資料夾

資料集下載後解壓得到一個名為VOCdevkit的資料夾，該資料夾結構如下：

.
└── VOCdevkit     #根目錄
    └── VOC2012   #不同年份的資料集，這裡只下載了2012的，還有2007等其它年份的
        ├── Annotations        #存放xml檔案，與JPEGImages中的圖片一一對應，解釋圖片的內容等等 

        ├── ImageSets          #該目錄下存放的都是txt檔案，txt檔案中每一行包含一個圖片的名稱，末尾會加上±1表示正負樣本
        │   ├── Action
        │   ├── Layout
        │   ├── Main
        │   └── Segmentation
        ├── JPEGImages         #存放源圖片
        ├── SegmentationClass  #存放的是圖片，分割後的效果，見下文的例子
        └── SegmentationObject #存放的是圖片，分割後的效果，見下文的例子

這裡大概介紹一下各個資料夾的內容，更細節的介紹將在後文給出：
- Annotation資料夾存放的是xml檔案，該檔案是對圖片的解釋，每張圖片都對於一個同名的xml檔案。
- ImageSets資料夾存放的是txt檔案，這些txt將資料集的圖片分成了各種集合。如Main下的train.txt中記錄的是用於訓練的圖片集合
- JPEGImages資料夾存放的是資料集的原圖片
- SegmentationClass以及SegmentationObject資料夾存放的都是圖片，且都是影象分割結果圖（樓主沒用過，所以不清楚）

Annotation資料夾

Annotation資料夾的內容如下：
這裡寫圖片描述

其中xml主要介紹了對應圖片的基本資訊，如來自那個資料夾、檔名、來源、影象尺寸以及影象中包含哪些目標以及目標的資訊等等，內容如下：

<annotation>
    <folder>VOC2012</folder>  #表明圖片來源
    <filename>2007_000027.jpg</filename> #圖片名稱
    <source>                  #圖片來源相關資訊
        <database>The VOC2007 Database</database>
        <annotation>PASCAL VOC2007</annotation>
        <image>flickr</image>
    </source>
    <size>     #影象尺寸
        <width>486</width>
        <height>500</height>
        <depth>3</depth>
    </size>
    <segmented>0</segmented> #是否用於分割
    <object>  #包含的物體
        <name>person</name> #物體類別
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>  #物體的bbox
            <xmin>174</xmin>
            <ymin>101</ymin>
            <xmax>349</xmax>
            <ymax>351</ymax>
        </bndbox>
        <part> #物體的頭
            <name>head</name>
            <bndbox>
                <xmin>169</xmin>
                <ymin>104</ymin>
                <xmax>209</xmax>
                <ymax>146</ymax>
            </bndbox>
        </part>
        <part>   #物體的手
            <name>hand</name>
            <bndbox>
                <xmin>278</xmin>
                <ymin>210</ymin>
                <xmax>297</xmax>
                <ymax>233</ymax>
            </bndbox>
        </part>
        <part>
            <name>foot</name>
            <bndbox>
                <xmin>273</xmin>
                <ymin>333</ymin>
                <xmax>297</xmax>
                <ymax>354</ymax>
            </bndbox>
        </part>
        <part>
            <name>foot</name>
            <bndbox>
                <xmin>319</xmin>
                <ymin>307</ymin>
                <xmax>340</xmax>
                <ymax>326</ymax>
            </bndbox>
        </part>
    </object>
</annotation>

ImageSets資料夾

ImageSets包含如下四個子資料夾：
這裡寫圖片描述
各個資料夾中存放的是各種用途的TXT檔案。例如在Main資料夾下有名為aeroplane_train.txt的檔案，顧名思義是用於飛機類別的訓練資料。該txt的具體內容如下，其中±1應該表示的是正負樣本的含義（沒有具體研究）：

2008_000008 -1
2008_000015 -1
2008_000019 -1
2008_000023 -1
2008_000028 -1
2008_000033  1
2008_000036 -1
2008_000037  1
2008_000041 -1
2008_000045 -1

其中包含的train.txt以及trainval.txt等檔案內容與上面類似。不過博主發現train.txt和trainval.txt內容中光有圖片的名字，末尾沒有標註正負1.

JEPGImages資料夾

該資料夾存放的是資料集的所有源圖片，內容如下：
這裡寫圖片描述

SegmentationClass資料夾

還沒有涉及影象分割領域，不太清楚該資料夾下圖片的用處，截圖貼上來吧：
這裡寫圖片描述

SegmentationObject資料夾

同上，把內容截圖上傳：
這裡寫圖片描述

Pascal Voc資料集詳細分析

前言

正文

相關網址

VOCdevkit資料夾

Annotation資料夾

ImageSets資料夾

JEPGImages資料夾

SegmentationClass資料夾

SegmentationObject資料夾

Pascal Voc資料集詳細分析

Pascal Voc資料集詳細介紹

【計算機視覺】PASCAL VOC資料集分析

PASCAL VOC資料集分析

PASCAL VOC資料集分析（分類部分）

PASCAL VOC資料集分析（檢測部分）

計算機視覺標準資料集整理—PASCAL VOC資料集

PASCAL VOC 資料集

PASCAL VOC資料集The PASCAL Object Recognition Database Collection

【Detection】物體識別-製作PASCAL VOC資料集

VOC資料集顏色對應關係與程式碼

VOC資料集用於製作tensorflow所需格式

CelebA資料集詳細屬性統計

PACAL VOC資料集格式的相關問題

yolo 學習筆記分享之--VOC資料集

配置FCN 8s voc資料集

Deeplab_v2+VOC資料集

ICnet基於VOC資料集的訓練

基於keras的YOLOv3在VOC資料集上訓練測試

利用python對泰坦尼克號資料集進行分析

Pascal Voc資料集詳細分析

前言

正文

相關網址

VOCdevkit資料夾

Annotation資料夾

ImageSets資料夾

JEPGImages資料夾

SegmentationClass資料夾

SegmentationObject資料夾

相關推薦