PASCAL VOC資料集分析
阿新 • • 發佈:2019-01-24
接下來需要研究的是如何自己生成訓練資料和測試資料,將在下一篇中闡述。
2. 轉載2
格式的annotations,則需要在程式碼中進行相應的修改。txt生成xml的程式碼稍後上傳
2. 轉載2
現在深度學習很多框架都在使用VOC資料集,來研究一下voc資料集的具體內容
一般voc解壓出來後都包括Annotations,ImageSets,JPEFImages,SegmentationClass ,SegmentationObject;
Annotations中是放著所有圖片的標記資訊,以xml為字尾名.以分類檢測的資料為例,開啟ImageSets中的layout,會有train,trainval,val三個txt格式資料,:
1 train 很明顯是訓練資料(注意,均為圖片名,沒有後綴)
2 val 驗證資料
3 trainval 則是所有訓練和驗證資料
4 test 測試資料
而ImageSets中的Main資料夾中儲存的是各類資料出現的統計,以areoplane為例,有三個相關檔案aeroplane_train.txt,areoplane_val,areoplane_trainval.txt,以areoplain_train.txt為例,分為兩列,第一列為影象名如00012(注意沒有後綴),第二列為-1和1,-1表示目標在對應的影象沒有出現,1則表示出現。
segmentationclass和segmentationobject中均為分割後的結果
Anotation資料夾中包含了所有train和val的標記資訊,標記資訊均以xml結尾,其中,以(x,y)的格式儲存座標點.在實際應用中,要不把資料集改為voc形式,如果使用txt