1. 程式人生 > >航空遙感影象(Aerial Images)目標檢測資料集彙總

航空遙感影象(Aerial Images)目標檢測資料集彙總

常規目標檢測資料集有很多,現在前沿的目標檢測演算法(如Faster R-CNN, Yolo, SSD, Mask R-CNN等)基本都是在這些常規資料集上實驗的,但是,基於常規資料集訓練的分類器,在航空遙感影象上的檢測效果並不好,主要原因是航空遙感影象有其特殊性:

1,尺度多樣性,航空遙感影象從幾百米到近萬米的拍攝高度都有,且地面目標即使是同類目標也大小不一,如港口的輪船大的有300多米,小的也只有數十米;

2,視角特殊性,航空遙感影象的視角基本都是高空俯視,但常規資料集大部分還是地面水平視角,所以同一目標的模式是不同的,在常規資料集上訓練的很好的檢測器,使用在航空遙感影象上可能效果很差;

3,小目標問題,航空遙感影象的目標很多都是小目標(幾十個甚至幾個畫素),這就導致目標資訊量不大,基於CNN的目標檢測方法在常規目標檢測資料集上一騎絕塵,但對於小目標,CNN的Pooling層會讓資訊量進一步減少,一個24*24的目標經過4層pooling後只有約1個畫素,使得維度過低難以區分出來;

4,多方向問題,航空遙感影象採用俯視拍攝,目標的方向都是不確定的(而常規資料集上往往有一定的確定性,如行人、車輛基本都是立著的),目標檢測器需要對方向具有魯棒性;

5,背景複雜度高,航空遙感影象視野比較大(通常有數平方公里的覆蓋範圍),視野中可能包含各種各樣的背景,會對目標檢測產生較強的干擾。

基於以上原因,對於航空遙感影象目標檢測任務,常規資料集往往難以訓練出理想的目標檢測器,需要專門的航空遙感影象資料庫。我整理了幾個:

1,DOTA:A Large-scale Dataset for Object Detection in Aerial Images,arXiv:1711.10398v1  [cs.CV]  28 Nov 2017。這是武大遙感國重實驗室夏桂鬆和華科電信學院白翔聯合做的一個數據集,2806張遙感影象(大小約4000*4000),188,282個instances,分為15個類別。樣本類別及數目如下(與另一個開放資料集NWPU VHR-10

對比):

2,UCAS-AOD: Dataset of Object Detection in Aerial Images,中科大模式識別實驗室標註的,只包含兩類目標:汽車,飛機,以及背景負樣本。樣本數量如下:

References:[1]H. Zhu, X. Chen, W. Dai, K. Fu, Q. Ye, J. Jiao, "Orientation Robust Object Detection in Aerial Images Using Deep Convolutional Neural Network," IEEE Int'l Conf. Image Processing, 2015.

3,NWPU VHR-10:西北工業大學標註的航天遙感目標檢測資料集,共有800張影象,其中包含目標的650張,背景影象150張,目標包括:飛機、艦船、油罐、棒球場、網球場、籃球場、田徑場、港口、橋樑、車輛10個類別。開放下載,大概73M.

4, RSOD-Dataset:武漢大學團隊標註,包含飛機、操場、立交橋、 油桶四類目標,數目分別為:

飛機:4993 aircrafts in 446 images. 操場: 191 playgrounds in 189 images. 立交橋: 180 overpass in 176 overpass.

油桶:1586 oiltanks in 165 images.

5, INRIA aerial image dataset: Inria是法國國家資訊與自動化研究所簡稱,該機構擁有大量資料庫,其中此資料庫是一個城市建築物檢測的資料庫,標記只有building, not building兩種,且是畫素級別,用於語義分割。訓練集和資料集採集自不同的城市遙感影象。連結:https://project.inria.fr/aerialimagelabeling/

為了方便大家下載,UCAS-AOD和ppef

相關推薦

航空遙感影象(Aerial Images)目標檢測資料彙總

常規目標檢測資料集有很多,現在前沿的目標檢測演算法(如Faster R-CNN, Yolo, SSD, Mask R-CNN等)基本都是在這些常規資料集上實驗的,但是,基於常規資料集訓練的分類器,在航空遙感影象上的檢測效果並不好,主要原因是航空遙感影象有其特殊性: 1,尺度

製作自己的目標檢測資料再利用tf-faster-rcnn訓練

1.製作資料集的工具 我利用資料集標註工具是精靈標註助手,我認為很好用。奉勸一句標註資料集時不要隨便找人給你標,如果他沒有用心給你標註,你在後面訓練會出現很多問題。在一開始標註資料集的時候不要一下子給他標註完,先標註幾十張圖片,然後用在你的網路裡,看看有沒有錯誤,如果沒有問

深度學習-目標檢測資料以及評估指標

資料集和效能指標 目標檢測常用的資料集包括PASCAL VOC,ImageNet,MS COCO等資料集,這些資料集用於研究者測試演算法效能或者用於競賽。目標檢測的效能指標要考慮檢測物體的位置以及預測類別的準確性,下面我們會說到一些常用的效能評估指標。 資料集 PA

目標檢測資料

1. Pascal VOC Dataset資料集共 21分類VOC 2012VOC 20072. ILSVRC2012部分下載連結:3、Coco資料集(微軟建立,要翻牆)下載官網http://cocodataset.org/

關於coco目標檢測資料格式

coco目標檢測資料集標註目標資訊採用的是資料格式是json,其內容本質是一種字典結構,字典堆疊和列表資訊內容維護。coco裡面的id和類名字對應:總共80類,但id號到90!coco_id_name_map={1: 'person', 2: 'bicycle', 3: 'c

影象分類和目標檢測常用資料介紹

The Caltech-UCSD birds-200-2011 dataset(加利福尼亞理工學院鳥類資料集): 分類數量:200 圖片數量:11,788 每個影象的註釋:15個部分位置,312個二進位制屬性,1邊界框 Labeled faces in the wild: L

計算機視覺筆記及資料整理(含影象分割、目標檢測小方向學習)

前言 1、簡單聊聊: 在我腦海中我能通過這些年聽到的技術名詞來感受到技術的更新及趨勢,這種技術發展有時候我覺得連關注的腳步都趕不上。簡單回顧看看,從我能聽到的技術名詞來感受,最開始耳聞比較多「雲端計算」這玩意,後來聽到比較多的是「資料探勘」,當時想著等考上研也要

實踐目標檢測--資料準備

環境 Windows10+Python3.6 實踐內容 手勢識別(識別1,2,3,4,5的手勢) 構造資料集 1、錄製視訊,用於資料集收集 2、使用opencv的方法擷取視訊幀 import cv2 vc = cv2.VideoCapture('shoushi3.

第十九節、基於傳統影象處理的目標檢測與識別(詞袋模型BOW+SVM附程式碼)

在上一節、我們已經介紹了使用HOG和SVM實現目標檢測和識別,這一節我們將介紹使用詞袋模型BOW和SVM實現目標檢測和識別。 一 詞袋介紹 詞袋模型(Bag-Of-Word)的概念最初不是針對計算機視覺的,但計算機視覺會使用該概念的升級。詞袋最早出現在神經語言程式學(NLP)和資訊檢索(IR)領域,該模型

一文帶你學會使用YOLO及Opencv完成影象及視訊流目標檢測(上)|附原始碼

計算機視覺領域中,目標檢測一直是工業應用上比較熱門且成熟的應用領域,比如人臉識別、行人檢測等,國內的曠視科技、商湯科技等公司在該領域佔據行業領先地位。相對於影象分類任務而言,目標檢測會更加複雜一些,不僅需要知道這是哪一類影象,而且要知道影象中所包含的內容有什麼及其在影象中的位置,因此,其工業應用比較廣泛。那麼

目標檢測資料擴增

import os import cv2 import xml.dom.minidom from xml.dom.minidom import Document import math #獲取路徑下所有檔案的完整路徑,用於讀取檔案用 def GetFileFromThis

影象分類,目標檢測,語義分割的FC的區別

還有半個月就要過年啦,提前給大夥拜個年哈哈,快放假了又進入了划水的階段啥都不太想幹,但是就算是划水也不能中斷思考啊,誰讓咱是搞技術的呢,過去的幾個月裡把語義分割,目標檢測和影象分類都稍微瞭解了一下,因為是入門階段所以聊得東西都比較簡單,這篇部落格就聊一聊這幾個任務在全連線層

影象分類、目標檢測影象分割區別

1、影象分類影象分類主要是基於影象的內容對影象進行標記,通常會有一組固定的標籤,而你的模型必須預測出最適合影象的標籤。這個問題對於機器來說相當困難的,因為它看到的只是影象中的一組數字流。上圖片來自於Google Images而且,世界各地經常會舉辦多種多樣的影象分類比賽。在K

第十八節、基於傳統影象處理的目標檢測與識別(HOG+SVM附程式碼)

其實在深度學習分類中我們已經介紹了目標檢測和目標識別的概念、為了照顧一些沒有學過深度學習的童鞋,這裡我重新說明一次:目標檢測是用來確定影象上某個區域是否有我們要識別的物件,目標識別是用來判斷圖片上這個物件是什麼。識別通常只處理已經檢測到物件的區域,例如,人們總是會使在已有的人臉影象的區域去識別人臉。 傳統的目

高光譜影象處理之目標檢測技術(CEM演算法)(影象處理)

高光譜影象處理之目標檢測技術一、高光譜影象處理之目標檢測1、高光譜影象目標檢測的發展趨勢和研究現狀:   20世紀80年代末,美國的一些研究機構開始利用高光譜影象資料進行目標檢測方面的研究。自上世紀九十

第三篇:基於深度學習的人臉特徵點檢測 - 資料整理

https://yinguobing.com/facial-landmark-localization-by-deep-learning-data-collate/ 在上一篇博文中,我們已經下載到了包括300-W、LFPW、HELEN、AFW、IBUG和300-VW在內的6個數據集,初步估算有2

製作PASCAL VOC格式的檢測資料,生成trainval.txt, train.txt, val.txt, test.txt檔案

import os import random xmlfilepath=r'C:\Users\Yeh Chih-En\Desktop\VOC\Annotations' saveBasePath=r"C:\Users\Yeh Chih-En\Desktop\VOC" trainval

虛假新聞檢測資料

1.FakeNewsNet 下載連結:https://github.com/KaiDMML/FakeNewsNet 說明:該資料集包含新聞內容和正確標註真假新聞標籤的社會語境特徵。 使用論文: (1)A Stylometric Inquiry into Hyperpartisan and

目標跟蹤資料OTB、VOT下載

2018年08月26日 12:07:10 博博有個大大大的Dream 閱讀數:361 標籤: 目標跟蹤資料集OTBVOT 更多 個人分類: 原創文章 1、OTB50和OTB100資料集官方下載地址: OTB50百度雲下載地址: 連結:https://pan.b

關於影象隱寫術的資料下載

steganalysis方向的文章,尤其是dl來做steganalysis的文章,通常都用BOSSbase這個資料集來進行驗證和對比。對比的物件常常是HUGO,WOW,SUNIWARD這幾種。因此分別瞭解一下。 先說資料集,BOSSbase 1.01 是一萬張圖片的資料集,