製作VOC型別資料集,生成txt,生成lmdb
前言:資料樣式參照PASCALVOC
需要檔案連結:http://pan.baidu.com/s/1gfeHDMN 密碼:o7h0
連結:http://pan.baidu.com/s/1nve53Wd 密碼:jbtt
一:生成txt
1:蒐集圖片,或者視訊資料等,利用標註工具,形成圖片資訊以及註釋資訊。
標註工具,自己編寫的,效果如下:
2:通過xml檔案以及圖片資訊形成ImageSets/Main/trainval.txt,test.txt,val.txt,trainval.txt
我將上述生成的JPEGImages與Annotations目錄放入VOC2007目錄下(替換了),然後新建ImageSets\Main目錄
如下:
執行makefile檔案會在ImageSets\Main下生成如下檔案:
內容大概如下:
到此步驟是可以拿去訓練faster rcnn等網路了。但是工程化的話,生成txt文件還是不行的,下面接受生成lmdb的方法。
二:生成lmdb(仿照SSD)
因為此步驟需要用到SSD\tools下的create_annoset.py檔案,所以我直接在SSD目錄下進行對應的操作。專案目錄如下,綠色的理解就行:
VOC07下面有這樣幾個檔案:
1:create_list.sh生成trainval.txt,,test_size_name.txt,test.txt
create_list.sh主要用來生成trainval.txt,test.txt,將檔名和配置檔案寫入同一檔案。
執行create_list.sh
2:編寫labelmap_voc.prototxt。
其中labelmap_vox.prototxt是類別標籤,如下,根據實際情況,增加item
3:create_data.sh生成lmdb檔案。
執行create_data.sh;生成如下:
製作完成!