王權富貴:VOC2007資料集格式詳解和下載
阿新 • • 發佈:2018-11-28
VOC2012和VOC2007的下載地址:
https://pjreddie.com/projects/pascal-voc-dataset-mirror/
- Annotations資料夾
- 該檔案下存放的是xml格式的標籤檔案,每個xml檔案都對應於JPEGImages資料夾的一張圖片。
- 這是最重要的,儲存重要的位置資訊
- size 是圖片的資訊
- object 是物體名稱資訊
- bndbox 是物體Xmin,Ymin,Xmin,Ymax的資訊
<annotation> <folder>VOC2007</folder> <filename>000001.jpg</filename> <source> <database>My Database</database> <annotation>VOC2007</annotation> <image>flickr</image> <flickrid>NULL</flickrid> </source> <owner> <flickrid>NULL</flickrid> <name>QQ974573656</name> </owner> <size> <width>500</width> <height>375</height> <depth>3</depth> </size> <segmented>0</segmented> <object> <name>person</name> <pose>Unspecified</pose> <truncated>0</truncated> <difficult>0</difficult> <bndbox> <xmin>213</xmin> <ymin>155</ymin> <xmax>283</xmax> <ymax>374</ymax> </bndbox> </object> </annotation>
- JPEGImages資料夾
- 改資料夾下存放的是資料集圖片,包括訓練和測試圖片。
- 以上兩個是最重要的資訊
- ImageSets資料夾
- 該資料夾下存放了三個檔案,分別是Layout、Main、Segmentation。在這裡我們只用存放影象資料的Main檔案,其他兩個暫且不管。
- 主要是main資料夾中的資訊
- 這裡train_test.txt放著的是要訓練的圖片檔名
- test.txt放著的是測試的的圖片檔名
- 物品名_test.txt這邊用來計算識別的準確率。(1表示有,0表示不好識別,-1表示沒有)
- SegmentationClass檔案和SegmentationObject檔案。
- 這兩個檔案都是與影象分割相關
- 對目標檢測沒有什麼用處