faster rcnn中資料標註pascal voc格式
阿新 • • 發佈:2018-12-16
<?xml version="1.0" encoding="utf-8"?> <annotation> <folder>VOC2007</folder> <filename>test100.mp4_3380.jpeg</filename> <size> <width>1280</width> <height>720</height> <depth>3</depth> </size> <object> <name>gemfield</name> <bndbox> <xmin>549</xmin> <xmax>715</xmax> <ymin>257</ymin> <ymax>289</ymax> </bndbox> <truncated>0</truncated> <difficult>0</difficult> </object> <object> <name>civilnet</name> <bndbox> <xmin>842</xmin> <xmax>1009</xmax> <ymin>138</ymin> <ymax>171</ymax> </bndbox> <truncated>0</truncated> <difficult>0</difficult> </object> <segmented>0</segmented> </annotation>
在這個測試圖片上,我們標註了2個object,一個是gemfield,另一個是civilnet。
在這個xml例子中:
- bndbox是一個軸對齊的矩形,它框住的是目標在照片中的可見部分;
- truncated表明這個目標因為各種原因沒有被框完整(被截斷了),比如說一輛車有一部分在畫面外; occluded是說一個目標的重要部分被遮擋了(不管是被背景的什麼東西,還是被另一個待檢測目標遮擋);
- difficult表明這個待檢測目標很難識別,有可能是雖然視覺上很清楚,但是沒有上下文的話還是很難確認它屬於哪個分類;標為difficult的目標在測試成績的評估中一般會被忽略。
注意:在一個<object />中,<name /> 標籤要放在前面,否則的話,目標檢測的一個重要工程實現SSD會出現解析資料集錯誤(另一個重要工程實現py-faster-rcnn則不會)。