1. 程式人生 > >Caltech行人資料集轉化VOC資料集

Caltech行人資料集轉化VOC資料集

CaltechPestrian2VOC

1. Seq檔案轉化成JEPG影象檔案

呼叫seq2jpg.py檔案,輸入data資料夾,輸出到JPEG資料夾中,解析後的圖片會是

2. VBB標註檔案轉化為XML檔案

呼叫vbb2voc.py檔案,輸入annotations資料夾,輸出到xmlresult資料夾中。

3.將所有的xml檔案一集JPEG檔案分別放到兩個統一的資料夾裡

呼叫mergeimg.py和mergexml.py檔案。

4.重新命名圖片和XML檔案

按照“xxxxxx”這樣的6位數字索引命名JPEG圖片檔案以及對應的XML檔案。

5.生成4個txt檔案指定訓練集、驗證集、資料集、訓練驗證集

呼叫generateTXT.py檔案,輸入xmlresult資料夾,輸出到ImageSets/Main資料夾中。

6. 替換標籤(輔助)

Caltech的標註裡有很多別的類別的行人,people,person,findPeople.py是將people標籤替換成person。這是一個輔助檔案,不是必須用到的。

IMPORTANT NOTES
I found there’re some errors in the vbb files. To be specific, some bounding boxes are out of the image such as the xmax is greater than the width of the image, which will cause big mistakes in training faster R-CNN. Therefore, you can mannually check the wrong xml files during training. Or I will try to correct the wrong bnd boxes later automatically.

相關推薦

Caltech行人資料轉化VOC資料

CaltechPestrian2VOC 1. Seq檔案轉化成JEPG影象檔案 呼叫seq2jpg.py檔案,輸入data資料夾,輸出到JPEG資料夾中,解析後的圖片會是 2. VBB標註檔案轉化為XML檔案 呼叫vbb2voc.py檔案,輸入a

Caffe-SSD 和Faster RCNN訓練 Caltech行人資料

前言:     本教程的主要內容:         1,將Caltech行人資料集轉換成Caffe-SSD,Faster RCNN系列能夠訓練的格式(VOC資料集格式);     2,同理,可以將INRIA,ETH,TUD等資料集轉換成VOC格式。     3,Caltec

VOC資料顏色對應關係與程式碼

VOC顏色和分類的對於關係:       code: def voc_colormap(N=256): def bitget(val, idx): return ((val & (1 << idx)) != 0)

VOC資料用於製作tensorflow所需格式

VOC資料集 VOC主要有三個重要的資料夾:Annotations、ImageSets和JPEGImages。分別是標註資訊、分割資訊和原始圖片等。 公開資料集有現成的對應檔案,前人已經做好標註工作。 在初步訓練網路時,選擇該組比較完備的資料,確實是一個比較快捷的方法。 XML到CS

PACAL VOC資料格式的相關問題

獲取指定畫素值的座標 image_path = 'C:\\Users\\Yeh Chih-En\\Desktop\\test_images\\0bb0672f1afd6baaf94c516bcfb7dfae.png' image = Image.open(i

yolo 學習筆記分享之--VOC資料

參考: <Pascal VOC & COCO資料集介紹 & 轉換> http://www.cnblogs.com/pprp/p/9629752.html 《Pascal Voc資料集詳細分析》https://blog.csdn.net/u01383270

配置FCN 8s voc資料

按著博文http://blog.csdn.net/u012968002/article/details/78958090 的流程走的  主要是各種路徑要搞清楚 參見http://blog.csdn.net/supe_king/article/details/58121993 中間出現在

Deeplab_v2+VOC資料

概述 Deeplab系列,是影象語意分割的經典之作,用深度學習的方法實現影象分割,繞不過系統學習Deeplab系列,而學習的最快途徑就是先把demo跑起來,之後再去細讀文獻和程式碼。 本部落格主要是基於v2版本的deeplab,使用VGG16模型,在VOC201

ICnet基於VOC資料的訓練

Voc4ICnet 資料集準備的目的:ICNET基於VOc資料集的訓練,和同時做分割和檢測的Blitznet做對比. 一、資料集標籤製作與準備: Pascal VOC資料集可用於目標檢測和分割,提供了語義分割標籤和例項分割標籤. 本文中使用的資料集為原始的pas

基於keras的YOLOv3在VOC資料上訓練測試

一、編譯環境 windows7 Anaconda+python3.6+keras+tensroflow+pyCharm 二、步驟 測試 從上文第二個github上下載工程,並用

Pascal Voc資料詳細介紹

1.首先了解VOC2012資料集的內容 資料集下載後解壓得到一個名為VOCdevkit的資料夾,該資料夾結構如下:  . └── VOCdevkit #根目錄 └── VOC2012 #不同年份的資料集,這裡只下載了2012的,還有2007等其它年份的

VOC資料顏色表

類別名稱 R G B background 0 0 0 背景 aeroplane 128 0 0 飛機 bicycle 0 128 0 bird 128 128 0 boat 0 0 128 bottle 128 0 128 瓶子 bus 0 128 128 大巴 car 128 1

VOC 資料

可變形網路 :https://github.com/msracver/Deformable-ConvNets VOC資料集: Test 引數 ('PascalVOC', '2007_test', './data', './data/VOCdevkit', './output/rcnn/voc/resne

No.3 ssd-caffe(2):訓練ssd-caffe模型:(以VOC資料為例)

2.訓練ssd-caffe模型:(以VOC資料集為例) 使用caffe進行目標檢測,我們的需要標註了標籤的圖片作為訓練樣本,訓練模型。推薦使用開源的標註工具labelimg,來對我們的圖片進行標註。標註之後,會產生.xml檔案,用於標識圖片中物體的具體資訊。

VOC資料mAP計算

檢測出來的bbox包含score和bbox,按照score降序排序,所以每新增一個樣本,就代表閾值降低一點(真實情況下score降低,iou不一定降低)。這樣就是可以有很多種閾值,每個閾值情況下計算一個prec和recall。 d:對模型檢測到的bbox迴圈:j:對該bbo

使用labelImg影象標註工具製作VOC資料

1.Linux下安裝brew install qt qt4brew install libxml2make qt4py2pythobelImg.py2.windows下安裝安裝安裝Anaconda2-4

利用Darket 和YOLOV3訓練自己的資料(製作VOC)

1. 配置Darknet 下載darknet原始碼:git clone https://github.com/pjreddie/darknet 進入darknet目錄: cd darknet 如果是cpu直接make,否則需要修改Makefile,設

使用keras版本的yoloV3訓練並在VOC資料上測試

一、環境需求:tensorflowkeras(編譯執行時按照錯誤提示pip install 相應庫檔案即可)二、Demo:1、下載程式碼:git clone https://github.com/qqwweee/keras-yolo32、下載yoloV3權重檔案:https:

caffe-ssd 訓練自己的VOC資料(一):轉換VOC xml資料為lmdb格式

假設你已經做好了VOC資料標籤,也就是xml檔案,並且已經配置好了caffe-ssd的環境 第一步,在caffe-ssd/data目錄下本身自帶有如下資料夾: 然後在caffe-ssd/data目錄下新建一個資料夾命名為VOCdevkit: 然後data目錄下有:

《我的PaddlePaddle學習之路》筆記九——使用VOC資料的實現目標檢測

目錄 前言 目標檢測的使用範圍很廣,比如我們使用相機拍照時,要正確檢測人臉的位置,從而做進一步處理,比如美顏等等。在目標檢測的深度學習領域上,從2014年到2016年,先後出現了R-CNN,Fast R-CNN, Faster R-CNN, I