1. 程式人生 > >faster rcnn中資料標註pascal voc格式

faster rcnn中資料標註pascal voc格式

<?xml version="1.0" encoding="utf-8"?>
<annotation>
    <folder>VOC2007</folder>
    <filename>test100.mp4_3380.jpeg</filename>
    <size>
        <width>1280</width>
        <height>720</height>
        <depth>3</depth>
    </size>
    <object>
        <name>gemfield</name>
        <bndbox>
            <xmin>549</xmin>
            <xmax>715</xmax>
            <ymin>257</ymin>
            <ymax>289</ymax>
        </bndbox>
        <truncated>0</truncated>
        <difficult>0</difficult>
    </object>
    <object>
        <name>civilnet</name>
        <bndbox>
            <xmin>842</xmin>
            <xmax>1009</xmax>
            <ymin>138</ymin>
            <ymax>171</ymax>
        </bndbox>
        <truncated>0</truncated>
        <difficult>0</difficult>
    </object>
    <segmented>0</segmented>
</annotation>

在這個測試圖片上,我們標註了2個object,一個是gemfield,另一個是civilnet。

在這個xml例子中:

  • bndbox是一個軸對齊的矩形,它框住的是目標在照片中的可見部分;
  • truncated表明這個目標因為各種原因沒有被框完整(被截斷了),比如說一輛車有一部分在畫面外; occluded是說一個目標的重要部分被遮擋了(不管是被背景的什麼東西,還是被另一個待檢測目標遮擋);
  • difficult表明這個待檢測目標很難識別,有可能是雖然視覺上很清楚,但是沒有上下文的話還是很難確認它屬於哪個分類;標為difficult的目標在測試成績的評估中一般會被忽略。

注意:在一個<object />中,<name /> 標籤要放在前面,否則的話,目標檢測的一個重要工程實現SSD會出現解析資料集錯誤(另一個重要工程實現py-faster-rcnn則不會)。