1. 程式人生 > >PASCAL VOC資料集分析(分類部分)

PASCAL VOC資料集分析(分類部分)

VOC2007資料集共包含:訓練集(5011幅),測試集(4952幅),共計9963幅圖,共包含20個種類。

資料集的組成架構如下:

  • Annotations —目標真值區域
  • ImageSets —-類別標籤
  • JPEGImages —–影象
  • SegmentationClass
  • SegmentationObjec

JPEGImages 中存放原始影象,jpg格式。大小一般為 500*375 或 375*500; 
ImageSets 中有三個資料夾【Layout】【Main】【Segmentation】,分類識別我們只關注【Main】,它內部儲存類別標籤,-1表示負樣本,+1為正樣本 
*_train.txt 訓練樣本集 
*_val.txt 評估樣本集 
*_trainval.txt 訓練與評估樣本彙總

2 各類別統計資訊

20個類別中,後面數字代表資料集中對應的的正樣本影象個數(非目標個數)。

- 訓練集

aeroplane 238 
bicycle 243 
bird 330 
boat 181 
bottle 244 
bus 186 
car 713 
cat 337 
chair 445 
cow 141 
diningtable 200 
dog 421 
horse 287 
motorbike 245 
person 2008 
pottedplant 245 
sheep 96 
sofa 229 
train 261 
tvmonitor 256

- 測試集

aeroplane 204 
bicycle 239 
bird 282 
boat 172 
bottle 212 
bus 174 
car 721 
cat 322 
chair 417 
cow 127 
diningtable 190 
dog 418 
horse 274 
motorbike 222 
person 2007 
pottedplant 224 
sheep 97 
sofa 223 
train 259 
tvmonitor 229

可以看出,除了person數量較多,其他類別樣本個數不算多。

因此,用VOC資料來訓練模型,做行人檢測或者車輛檢測,資料是不夠的,需要自己擴充資料。