1. 程式人生 > >PASCAL VOC資料集分析

PASCAL VOC資料集分析

接下來需要研究的是如何自己生成訓練資料和測試資料,將在下一篇中闡述。

2. 轉載2

現在深度學習很多框架都在使用VOC資料集,來研究一下voc資料集的具體內容

一般voc解壓出來後都包括Annotations,ImageSets,JPEFImages,SegmentationClass ,SegmentationObject;

Annotations中是放著所有圖片的標記資訊,以xml為字尾名.以分類檢測的資料為例,開啟ImageSets中的layout,會有train,trainval,val三個txt格式資料,:

1 train 很明顯是訓練資料(注意,均為圖片名,沒有後綴)

2 val    驗證資料

3 trainval 則是所有訓練和驗證資料

4 test  測試資料

而ImageSets中的Main資料夾中儲存的是各類資料出現的統計,以areoplane為例,有三個相關檔案aeroplane_train.txt,areoplane_val,areoplane_trainval.txt,以areoplain_train.txt為例,分為兩列,第一列為影象名如00012(注意沒有後綴),第二列為-1和1,-1表示目標在對應的影象沒有出現,1則表示出現。

segmentationclass和segmentationobject中均為分割後的結果

Anotation資料夾中包含了所有train和val的標記資訊,標記資訊均以xml結尾,其中,以(x,y)的格式儲存座標點.在實際應用中,要不把資料集改為voc形式,如果使用txt

格式的annotations,則需要在程式碼中進行相應的修改。txt生成xml的程式碼稍後上傳