1. 程式人生 > >計算機視覺/深度學習資料集

計算機視覺/深度學習資料集

1 ISPRS資料集
ISPRS官方提供了航空、無人機、傾斜影像資料進行密集匹配和三維重建,以下給出相應的資料獲取地址。注意這三組資料的下載都是免費的,但是需要填寫登記表並用郵件發給資料提供方,提供方會將最終的下載連結發至郵箱。

1.1 航空資料

一共提供了兩組航空實驗資料,一組是高樓林立的加拿大Toronto地區,另一組是半農村地區的德國Vaihingen地區。兩組資料的航向重疊度為60%,旁向重疊度為30%。

1.2 無人機資料

1.3 傾斜資料

2 EuroSDR資料集
一共提供了兩組航空實驗資料,一組是高樓林立的德國Muenchen地區,另一組是半農村地區的德國Vaihingen地區。兩組資料的航向重疊度為80%,旁向重疊度為60%。

3 Middlebury資料集

Middlebury視覺網站提供了計算機視覺領域研究立體匹配最重要的標準測試集,該網站給出的影像都是經過核線校正的近景影像。影像型別十分豐富,包含弱紋理、重複紋理、陰影、光照差異等難以處理的情況下的立體影像。

4 KITTI資料集
KITTI針對自動駕駛領域的研究,給出了豐富的街景立體核線影像。

5 中科院自動化所資料集
國內的中科院自動化研究所提供了多組近景三維重建的資料集。

6. CIFAR-10 & CIFAR-100
    CIFAR-10包含10個類別,50,000個訓練影象,彩色影象大小:32x32,10,000個測試影象。

    (類別:airplane,automobile, bird, cat, deer, dog, frog, horse, ship, truck)

    (作者:Alex Krizhevsky, Vinod Nair, and Geoffrey Hinton)

    (資料格式:Python版本、Matlab版本、二進位制版本<for C程式>)

     CIFAR-100與CIFAR-10類似,包含100個類,每類有600張圖片,其中500張用於訓練,100張用於測試;這100個類分組成20個超類。每個影象有一個"find" label和一個"coarse"label。
 

7. 影象分類結果及對應的論文
    影象分類結果及應的論文,包含資料集:MNIST、CIFAR-10、CIFAR-100、STL-10、SVHN、ILSVRC2012 task 1     

    ILSVRC: ImageNet Large Scale Visual Recognition Challenge

8. ImageNet
    ImageNet相關資訊如下:

    1)Total number of non-empty synsets: 21841
    2)Total number of images: 14,197,122
    3)Number of images with bounding box annotations: 1,034,908
    4)Number of synsets with SIFT features: 1000
    5)Number of images with SIFT features: 1.2 million

9. COCO
    COCO(Common Objects in Context)是一個新的影象識別、分割、和字幕資料集,它有如下特點:

    1)Object segmentation

    2)Recognition in Context
    3)Multiple objects per image
    4)More than 300,000 images
    5)More than 2 Million instances
    6)80 object categories
    7)5 captions per image
    8)Keypoints on 100,000 people

    COCO 2016 Detection Challenge(2016.6.1-2016.9.9)和COCO 2016 Keypoint Challenge(2016.6.1-2016.9.9)已經由Microsoft發起 由ECCV 2016(ECCV:European Conference On Computer Vision )。

   3)Human3.6M (3D Human Pose Dataset)

         - 《Iterated Second-Order Label Sensitive Pooling for 3D Human Pose Estimation》