王權富貴：VOC2007資料集格式詳解和下載

阿新 • • 發佈：2018-11-28

VOC2012和VOC2007的下載地址：

https://pjreddie.com/projects/pascal-voc-dataset-mirror/

Annotations資料夾

該檔案下存放的是xml格式的標籤檔案，每個xml檔案都對應於JPEGImages資料夾的一張圖片。
這是最重要的，儲存重要的位置資訊
size 是圖片的資訊
object 是物體名稱資訊
- bndbox 是物體Xmin,Ymin,Xmin,Ymax的資訊

<annotation>
    <folder>VOC2007</folder>
    <filename>000001.jpg</filename>
    <source>
        <database>My Database</database>
        <annotation>VOC2007</annotation>
        <image>flickr</image>
        <flickrid>NULL</flickrid>
    </source>
    <owner>
        <flickrid>NULL</flickrid>
        <name>QQ974573656</name>
    </owner>
    <size>
        <width>500</width>
        <height>375</height>
        <depth>3</depth>
    </size>
    <segmented>0</segmented>
    <object>
        <name>person</name>
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>
            <xmin>213</xmin>
            <ymin>155</ymin>
            <xmax>283</xmax>
            <ymax>374</ymax>
        </bndbox>
    </object>
</annotation>

JPEGImages資料夾

改資料夾下存放的是資料集圖片，包括訓練和測試圖片。

以上兩個是最重要的資訊

ImageSets資料夾

該資料夾下存放了三個檔案，分別是Layout、Main、Segmentation。在這裡我們只用存放影象資料的Main檔案，其他兩個暫且不管。

主要是main資料夾中的資訊

這裡train_test.txt放著的是要訓練的圖片檔名

test.txt放著的是測試的的圖片檔名

物品名_test.txt這邊用來計算識別的準確率。（1表示有，0表示不好識別，-1表示沒有）

SegmentationClass檔案和SegmentationObject檔案。

這兩個檔案都是與影象分割相關

對目標檢測沒有什麼用處

王權富貴：VOC2007資料集格式詳解和下載

VOC2012和VOC2007的下載地址： https://pjreddie.com/projects/pascal-voc-dataset-mirror/ Annotations資料夾該檔案下存放的是

Linux 網路程式設計——TCP 和 UDP 資料報格式詳解

TCP 報文格式 TCP（Transmission Control Protocol 傳輸控制協議）是一種面向連線的、可靠的、基於位元組流的傳輸層通訊協議。 TCP 報文段的報頭有 10 個必需的欄位和 1 個可選欄位。報頭至少為 20 位元組。報頭後面的資料是可選

Spark彈性分散式資料集RDD詳解

【Spark】彈性分散式資料集RDD概述彈性分佈資料集RDD RDD(Resilient Distributed Dataset)是Spark的最基本抽象，是對分散式記憶體的抽象使用，實現了以操作本地集合的方式來操作分散式資料集的抽象實現。RDD是Sp

Nginx-第四篇：在實踐中對日誌格式詳解和日誌檔案按日期進行分割

從上面我們可以看出幾部分資訊： 01.【$remote_addr】客戶端（使用者）IP地址。如：上例中的 201.0.69.2 02.【$remote_user】記錄客戶端使用者名稱稱 03.【[$time_local]】訪問時間。如：上例中的 [26/Jul/2018:03:17:20

王權富貴：Faster-Rcnn詳解

背景這一切始於 2014 年的一篇論文「Rich feature hierarchies for accurate object detection and semantic segmentation」(R-CNN)，其使用了稱為 Selective Search 的演算法用來提取感興趣候選區

批量修改資料夾JPEGImages中圖片的名字為voc2007資料集要求的格式

#-*-coding:utf-8-*- import os path_0 = "./**" i=1 for item in os.listdir(path_0): old_name = os.path.join(path_0,item) new_name = os.path.

【Java Web】： JSON 資料格式詳解

JSON (JavaScript Object Notation) JavaScript物件圖，它是由Douglas Crockford(道格拉斯·克洛克福特)發明的。 JSON與XML一樣

【Java Web】： GSON 資料格式詳解

在上一講中我們講到了 JSON資料格式的內容,這一講我們來講一下Google對JSON這種格式的支援。我們看到Java中的JSON庫除了org.json之外還有一個 google-g

COCO資料集格式互換

poly->compacted RLE: seg=np.array([312.29, 562.89, 402.25, 511.49, 400.96, 425.38, 398.39, 372.69, 388.11, 332.85, 318.71, 325.14, 295

PACAL VOC資料集格式的相關問題

獲取指定畫素值的座標 image_path = 'C:\\Users\\Yeh Chih-En\\Desktop\\test_images\\0bb0672f1afd6baaf94c516bcfb7dfae.png' image = Image.open(i

Andrew Ng 機器學習筆記 15 ：大資料集梯度下降

隨機梯度下降隨機梯度下降原理小批量梯度下降小批量梯度下降vs隨機梯度下降隨機梯度下降的收

MOT17資料集格式

本文引用自 link 目錄目錄 Datafromat Datafromat gt.txt檔案內容如圖所示 1,1,912,484,97,109,0,7,1 2,1,912,484,

Kitti資料集轉成VOC（xml）資料集格式

本文將kitti資料集中的檢測部分的資料標註轉換成voc格式的xml，用於生成caffe-ssd訓練的lmdb資料，具體資料集自己下載，標註圖片大概七千多張。 kitti格式標註及圖片轉voc格式標註及圖片（主要是扣掉了dontcare部分），具體程式碼如下： #!/usr/bin

【linux】Valgrind工具集詳解（八）：Memcheck命令列引數詳解

【linux】Valgrind工具集詳解（五）：命令列詳解中不夠全，在此專門針對Memcheck工具中的命令列引數做一次詳細的解釋。 Memcheck命令列選項 –leak-check=<no|summary|yes|full> [default: summary]

王權富貴：SyntaxError: Non-ASCII character '\xe4' in file C:/.....on line 5, but no encoding declared; se

原因：在編寫Python時，當使用中文輸出或註釋時，執行指令碼會提示錯誤資訊： SyntaxError: Non-ASCII character '\xe5' in file ******* 解決方法： python的預設編碼檔案是用的ASCII碼，你將檔案存成了UTF-8，

王權富貴：安裝OpenCV匯入的時候出現DLL load failed：找不到指定模組 or %1不是有效的32位程式

問題：網上找了好多方法（1）版本不匹配（失敗）（2）安裝microsoft Visual C++ distributed 2015 X64（失敗）（3）升級window10（沒有嘗試）（3）複製什麼什麼檔案到什麼什麼目錄下（失敗）（4）ht

王權富貴：RCNN的成長曆程

暴力目標檢測 &n

王權富貴：GPU配套的計算能力

CUDA-Enabled Tesla Products Tesla Workstation Products GPU Compute Capability Tesla K80 3.7

王權富貴：讀取指定目錄下的所有檔名（不保持字尾）文字處理

import os import os.path as osp rootdir = "C:\YSRVOC\VOCdevkit\VOC2007\JPEGImages" file_object = open('C:\YSRVOC\VOCdevkit\VOC2007\ImageSets\Main/tr

王權富貴：強化學習Q-learning

參考文章：（感謝辛勤翻譯的小哥哥小姐姐誒）作者: peghoty 出處: http://blog.csdn.net/peghoty/article/details/9361915 本文是對 http://mnemstudio.org/path-fin

王權富貴：VOC2007資料集格式詳解和下載

相關推薦