1. 程式人生 > >製作VOC型別資料集,生成txt,生成lmdb

製作VOC型別資料集,生成txt,生成lmdb

前言:資料樣式參照PASCALVOC

需要檔案連結:http://pan.baidu.com/s/1gfeHDMN 密碼:o7h0 

連結:http://pan.baidu.com/s/1nve53Wd 密碼:jbtt

一:生成txt

1:蒐集圖片,或者視訊資料等,利用標註工具,形成圖片資訊以及註釋資訊。

標註工具,自己編寫的,效果如下:


2:通過xml檔案以及圖片資訊形成ImageSets/Main/trainval.txt,test.txt,val.txt,trainval.txt

我將上述生成的JPEGImages與Annotations目錄放入VOC2007目錄下(替換了),然後新建ImageSets\Main目錄

如下:


執行makefile檔案會在ImageSets\Main下生成如下檔案:


內容大概如下:


到此步驟是可以拿去訓練faster rcnn等網路了。但是工程化的話,生成txt文件還是不行的,下面接受生成lmdb的方法。

二:生成lmdb(仿照SSD) 

因為此步驟需要用到SSD\tools下的create_annoset.py檔案,所以我直接在SSD目錄下進行對應的操作。專案目錄如下,綠色的理解就行:


VOC07下面有這樣幾個檔案:


1:create_list.sh生成trainval.txt,,test_size_name.txt,test.txt

create_list.sh主要用來生成trainval.txt,test.txt,將檔名和配置檔案寫入同一檔案。

執行create_list.sh

2:編寫labelmap_voc.prototxt。

其中labelmap_vox.prototxt是類別標籤,如下,根據實際情況,增加item

3:create_data.sh生成lmdb檔案。

執行create_data.sh;生成如下:


製作完成!