1. 程式人生 > >轉發--目前開源資料集整理

轉發--目前開源資料集整理

---------------------

本文來自 忘情擺渡 的CSDN 部落格 ,全文地址請點選:https://blog.csdn.net/wangqingbaidu/article/details/80635618?utm_source=copy 

Attention!

我的Dr.Sure專案正式上線了,主旨在分享學習Tensorflow以及DeepLearning中的一些想法。期間隨時更新我的論文心得以及想法。

Images Analysis

資料集 介紹 備註 網址
Flickr30k 圖片描述 31,783 images,每張圖片5個語句標註 連結
Microsoft COCO 圖片描述 330,000 images,每張圖片至少5個語句標註 連結
ESP Game 多標籤定義影象 20,770 images,268 tags,諸如bed, light man,music 連結
IAPRTC-12 多標籤定義影象 19,452 images,291 tags 連結
NUS-WIDE 多標籤定義影象 269,648 images,several tags (2-5 on average) per image 連結
CUHK-PEDES 以文搜圖 34,054 images,每張圖片2條描述 連結
VRD 視覺關係檢測 5,000 images, 100目錄,37,993對關係 連結
sVG 視覺關係檢測 108,000 images, 998,000對關係 連結
Visual Genome Dataset 影象屬性檢測 108,077 images, 5.4 M 區域塊,2.8 M 屬性,2.3 M 關係 連結
VQA 問答系統 1,105,904問題,11,059,040 回答 連結
Visual7W 問答系統 327,939 問答對 連結
TID2013 影象質量評價 25張參考影象,24個失真型別 連結
CSIQ 影象質量評價 30張參考影象,6個失真型別 連結
LIVE 影象質量評價 29張參考影象,5個失真型別 連結
WATERLOO 影象質量評價 4744張參考影象,20個失真型別 連結
photo.net 影象美觀評價 20,278張影象,打分[0,10] 連結
DPChallenge.com 影象美觀評價 16,509張影象,打分[0,10] 連結
CUHK 影象美觀評價 28,410張影象,只分高質量和低質量 連結
AVA 影象美觀評價 255,500張影象,打分[0,10] 連結

Image Motion & Tracking

資料集 介紹 備註 網址
CUHK03 Person re-identification(人重識別) image num:13164 person num:1360 camera num:10( 5 pairs) 連結
CUHK02 Person re-identification(人重識別) image num:7264 person num:1816 camera num:10( 5 pairs) 連結
CUHK01 Person re-identification(人重識別) image num:3884 person num:971 camera num: 2 連結
VIPeR Person re-identification(人重識別) image num:1264 person num:632 camera num:2 連結
ETH1,2,3 Person re-identification(人重識別) image num:8580 person num:83,35,28 camera num:1 連結
PRID2011 Person re-identification(人重識別) image num:24541 person num:934 camera num:2 連結
MARS Person re-identification(人重識別) image num:11910031 person num:1261 camera num:6 連結
Market1501 Person re-identification(人重識別) image num:32217 person num:1501 camera num:6 連結
Epic Fail (EF) dataset Risk Assessment(風險評估) video num:3000 連結
Street Accident (SA) dataset Risk Assessment(風險評估) video num:1733 連結
OTB-50 visual tracking(跟蹤) video num:50 連結
OTB-100 visual tracking(跟蹤) video num:100 連結
VOT2015 visual tracking(跟蹤) video num:60 連結
ALOV300 visual tracking(跟蹤) video num:314 連結
MOT visual tracking(跟蹤) video num:train:11 test:11 連結
THUMOS Temporal action localization(動作定位) video num:~3K activities class:20 instances:~3K 連結
ActivityNet Temporal action localization(動作定位) video num:20k activities class:200 instances:7.6K 連結
Mexaction2 Temporal action localization(動作定位) activities class:2 instances:1975 連結
FlyingChairs dataset optical flow(光流) image pairs:22k 連結
FlyingThings3D optical flow(光流) image pairs:22k 連結
KITTI benchmark suite optical flow(光流) image pairs:1600 連結
MPI Sintel optical flow(光流) image pairs:1064 連結

Video Analysis & Scene Understanding

資料集 介紹 備註 網址
UCF101 動作行為識別 13320 video,101類動作,主要是五大類:1)人-物互動;2)肢體運動;3)人-人互動;4)彈奏樂器;5)運動 連結
HMDB51 動作行為識別 7000 videos,51類,包括人臉表情動作,身體動作,人與人互動等 連結
Moments-in-Time 動作行為識別 1,000,000 videos,339類 連結
ActivityNet 1.3 動作行為識別 20,000 videos,200類 連結
Kinetics 動作行為識別 300,000 videos,400類 連結
AVA 動作行為識別 57,600 videos,80類 連結
Collective Activity Dataset 群體活動行為識別 44 videos,穿叉、行走、等待、交談和排隊 五類 連結
Choi’s New Dataset 群體活動行為識別 32 videos,聚會,談話,分開,一起走,追逐和排隊 六類 None
ActivityNet 1.3 檢測動作事件的起始時間和終止時間 20,000 videos,200類動作的起始時間和終止時間 連結
THUMOS 檢測動作事件的起始時間和終止時間 15,000 videos,101類動作的起始時間和終止時間 連結
MED 事件檢測 32,744 videos,20個事件 連結
EventNet 事件檢測 90,000 videos,500個事件 連結
Columbia Consumer Video 事件檢測 9,317 videos,20個事件 連結
ADE20K 事件檢測 20,210 videos,900個事件 連結
DAVIS 視訊主物體分割 50 videos,分割標註 連結
FBMS 視訊主物體分割 59 videos,分割標註 連結
IJB-C 視訊人臉識別 11,000 videos, 連結
YouTube Faces 視訊人臉識別 3,425 videos,1595 人 連結
MS-Celeb-1M 視訊人臉識別 1,000,000 images,21,000人 連結
MSVD 視訊描述 1,970 videos 連結
MSR-VTT-10K 視訊描述 10,000 videos 連結
MSR-VTT-10K 視訊描述 連結

3D Computer Vision

資料集 介紹 備註 網址
photoface database 基於光度立體視覺的二維和三維人臉識別資料庫 總共7356張影象,包含1839個session和261個subjects None
NYU Depth V2 dataset 關於RGBD 影象場景理解的資料庫 提供1449張深度圖片和他們的密集2d點類標註 連結
SUN RGBD dataset 是上面的NYU Depth V2 dataset的超集,多了3D bounding boxes和room layouts的標註。 有10,000張RGB-D圖片,有58,657個3D包圍框和146,617 個2d包圍框。 連結
PASCAL3D+ 新的三維物體檢測和姿態估計資料集,從PASCAL VOC 演化而來,包含影象,註解,和3D CAD模型 總共12個類,平均每個類別有3000多個例項 連結
IKEA 包含典型室內場景的三維模型的資料庫,例如桌子椅子等 包含大約759張圖片和219個3D模型 連結
New Tsukuba Dataset 包含了很多立體物體對的資料庫,用於立體物體匹配 總共1800個立體物體對,以及每立體對的立體視差圖、遮擋圖和不連續圖 連結
Oxford RobotCar Dataset 關於戶外自動駕駛的資料集。 包含在駕駛汽車過程從6個攝像頭收集的2000w張圖片,和當時的鐳射雷達,GPS和地面實況標註。 連結
Middlebury V3 包含高解析度物體立體視差標註的資料庫 包含33個類,沒有明說每類有多少資料 連結
ShapeNet 包含3D模型,和3d模型的類別標註的資料集,覆蓋了常用的3D資料集PASCAL 3D+。 它涵蓋55個常見的物件類別,有大約51,300個3D模型 連結
MICC dataset 包含了3D人臉掃描和在不同解析度,條件和縮放級別下的幾個視訊序列的資料庫。 有53個人的立體人臉資料 連結
CMU MoCap Dataset 包含了3D人體關鍵點標註和骨架移動標註的資料集。 有6個類別和23個子類別,總共2605個數據。 連結
DTU dataset 關於3D場景的資料集。 有124個場景,每場景有49/64個位置的RGB影象和結構光標註。 連結

Analyzing Humans in Images

資料集 介紹 備註 網址
MSR-Action3D 包含深度的動作識別資料集, 有20個動作,總共557個序列。 連結
Florence-3D 包含深度的動作識別資料集, 有9個動作,總共215個動作序列。 連結
Berkeley MHAD 包含深度的動作識別資料集, 有11個動作,產生660個動作序列。 連結
Online Action Detection 包含深度的動作識別資料集, 資料集包含59個長序列,包含10種不同的日常生活行為。 連結
ChaLearn LAP IsoGD Dataset RGB-D影象的手勢識別的資料集。 包括47933個RGB-D手勢視訊,有249個手勢標籤。Training有35878視訊,Validation有5784個,test有6271個 連結
MAFA dataset 關於面部遮擋問題的資料集 有30, 811張人臉和35806張有遮擋的臉組成。 連結
MSRC-12 Kinect Gesture Dataset 手勢識別資料集 有4900張圖片,包含12個不同手勢, 連結
2013 Chalearn Gesture Challenge dataset 手勢識別資料集 有11000張圖片,包含20個不同手勢, 連結
WIDER FACE 人臉檢測資料集 有 32,203 張圖片,標註了393703個人臉。 連結
FDDB 人臉檢測資料集 2845張圖片,標註了5171張人臉。 連結
300-VW dataset 面部表情資料集 包含114個視訊和總計218,595幀。 連結
HMDB51 人類行為識別的資料集 包含51個動作,總共有6766個視訊剪輯 連結
MPII Cooking Activities Dataset 人類行為識別的資料集 包含65個動作,有5609個視訊 連結
UCF101 人類行為識別的資料集 包含101個動作,有13320個視訊 連結
IJB-A dataset 包含視訊和圖片人臉識別的資料集 包含5712個影象和2085個視訊 連結
YouTube celebrities 視訊人臉識別的資料集 包含47位名人的1910個視訊 連結
COX 視訊人臉識別的資料集 包含1000個主題的4000個視訊 連結
Human3.6M 人體姿態估計的資料集 360萬張3D照片,11名受試者在4個視點下執行15個了不同的動作 連結
iLIDS 行人重識別的資料集 476 張影象,包含119個人 連結
VIPeR 行人重識別的資料集 632個行人圖片對(由兩個相機拍攝) 連結
CUHK01 行人重識別的資料集 包含971行人, 3884張圖片 連結
CUHK03 行人重識別的資料集 包含1360行人, 13164張圖片 連結
RWTH-PHOENIX-Weather multi-signer 2014 手語識別的資料集 包含了5672個德語手語的句子,有65,227個手語姿勢和799,006幀 連結
AFLW 人類面部關鍵點的資料集 總共約有25k張臉,每幅影象標註了大約21個位置。 連結
CMU mocap database 動作識別的資料集 2235個數據,包含144個不同的動作。 連結
Georgia Tech (GT) database 人臉識別資料庫 50個人每人15張人臉。 連結
ORL 人臉識別資料庫 40個人每個人10張圖。 連結

Application

資料集 介紹 備註 網址
DogCentric Activity Dataset 第一視角的狗和人之間的相互行為的資料集(視訊) 總共有10類,具體資料量沒有明說,y是動作類別 連結
JPL First-Person Interaction Dataset 第一視角觀察動作的資料集 57個視訊,8個大類,y是動作類別 連結
NUS-WIDE 關於影象文字匹配的資料集 269,648個影象和對應的標籤 連結
LabelMe Dataset 關於影象文字匹配的資料集 3825個影象和對應標籤 連結
Pascal Dataset 關於影象文字匹配的資料集 5011張訓練影象和4952張測試影象 )
ICDAR 2015 關於文字檢測的資料集 1500張訓練,1000張測試,y為四邊形的四個頂點。 連結
COCO-Text 關於文字檢測的資料集 63686張圖片,其中43686張被選為訓練集,剩下的2萬用於測試。 連結
MSRA-TD500 關於文字檢測的資料集 300個訓練,200個測試影象 連結
Microsoft 7-Scenes Dataset 室內人體運動的資料集 有7種不同室內環境,每包含500-1000張影象視訊序列。 連結
Oxford RobotCar 戶外自動駕駛資料集 包含影象,鐳射掃描結果和GPS資料。 連結

Low- & Mid-Level Vision

資料集 介紹 備註 網址
Deep Video Deblurring for Hand-held Cameras video/image deblurring(影象去模糊) video num:71 video time: 3-5s blurry and sharp pair image num:6708 連結
GOPRO dataset video/image deblurring(影象去模糊) blurry and sharp pair image num:3214 train num:2103 test num:1111 連結
BSD68 image restoration(影象修復)/高斯降噪 image num:68 連結
BSD100 “image restoration(影象修復)super resolution超解析度重建” image num:100 連結
Set5 “image restoration(影象修復)super resolution超解析度重建” image num:5 連結
Set14 “image restoration(影象修復)super resolution超解析度重建” image num:14 連結
Urban100 “image restoration(影象修復)super resolution超解析度重建” image num:100 連結
NYU v2 dataset “image restoration(影象修復)depth super resolution深度超解析度重建” image num:1449 連結
Middlebury dataset “image restoration(影象修復)depth super resolution深度超解析度重建” image pair num: 33 連結
alpha matting benchmark Natural image matting(摳圖) “train num:27,test num:8” 連結
real image benchmark Natural image matting(摳圖) “train num:49300,test num:1000” 連結
MSRA10K/MSRA-B Image saliency detection(顯著性區域檢測) image num(MSRA10K):10000 image num(MSRA-B):5000 連結
ECSSD Image saliency detection(顯著性區域檢測) image num:1000 連結
DUT-OMRON Image saliency detection(顯著性區域檢測) image num:5168 連結
PASCAL-S Image saliency detection(顯著性區域檢測) image num:850 連結
HKU-IS Image saliency detection(顯著性區域檢測) image num:4447 連結
SOD Image saliency detection(顯著性區域檢測) image num:300 連結
Describable Textures Dataset texture synthesis(紋理合成) image num:5640 category num:47 split train:val:test = 1:1:1 連結
CVPPP leaf segmentation Instance segmentation(樣例分割) image num: 161 train num: 128 test num: 33 連結
KITTI car segmentation Instance segmentation(樣例分割) image num: 3976 train num: 3712 test num: 144 val:120 連結
Cityscapes Instance segmentation(樣例分割) image num: 5000 train num: 2975 test num: 1525 val:500 連結
SYMMAX Symmetry Detection(對稱性檢測) image num: train:200 test:100 連結
WHSYMMAX Symmetry Detection(對稱性檢測) image num: train:228 test:100 object num: 1 連結
SK506 Symmetry Detection(對稱性檢測) image num: train:300 test:206 object num: 16 連結
Sym-PASCAL Symmetry Detection(對稱性檢測) image num: train:648 test:787 object num: 14 連結
Color Checker Dataset Color constancy(顏色恆定) image num: 568 連結
NUS 8-Camera Dataset Color constancy(顏色恆定) image num: 1736 連結

Text

資料集 介紹 備註 網址
Stanford Sentiment Treebank 文字情感分析 11855個句子劃分為239231個短語,每個短語有個概率值,越小越負面,越大越正面 連結
IMDB 文字情感分析 100,000句子,正面負面兩類 連結
Yelp 文字情感分析 連結
Multi-Domain Sentiment Dataset(Amazon product) 文字情感分析 100,000+句子,正面負面2類或強正面、弱正面、中立、弱負面、強負面5類 連結
SemEval 文字情感分析 20,632句子,三類(正面、負面、中立) 連結
Sentiment140(STS) 文字情感分析 1,600,000句子,三類(正面、負面、中立) 連結

--------------------- 本文來自 忘情擺渡 的CSDN 部落格 ,全文地址請點選:https://blog.csdn.net/wangqingbaidu/article/details/80635618?utm_source=copy 

相關推薦

轉發--目前開源資料整理

--------------------- 本文來自 忘情擺渡 的CSDN 部落格 ,全文地址請點選:https://blog.csdn.net/wangqingbaidu/article/details/80635618?utm_source=copy  Atten

目前開源資料整理

Attention! 我的Dr.Sure專案正式上線了,主旨在分享學習Tensorflow以及DeepLearning中的一些想法。期間隨時更新我的論文心得以及想法。 Images Analysis 資料集 介紹 備註

第三篇:基於深度學習的人臉特徵點檢測 - 資料整理

https://yinguobing.com/facial-landmark-localization-by-deep-learning-data-collate/ 在上一篇博文中,我們已經下載到了包括300-W、LFPW、HELEN、AFW、IBUG和300-VW在內的6個數據集,初步估算有2

機器學習、深度學習開源資料分享

轉自:機器學習演算法與Python學習 機器學習演算法與Python學習 微訊號guodongwei1991 功能介紹作為溝通學習的平臺,釋出機器學習與資料探勘、深度學習、Python實戰的前沿與動態,歡迎機器學習愛好者的加入,希望幫助你在AI領域更好的發展,期待與你相遇! 今天

資料整理】人體行為識別和影象識別

原連結:https://blog.csdn.net/liuxiao214/article/details/78889662 謝謝博主的整理,轉載一下以便查閱。   一共12個人體行為識別的資料集,基於視訊的; 6個影象識別的,有關物體識別、行人識別、年齡識別和人頭檢測的,基

資料 | 開源資料(計算機視覺影象、定位、識別)

博主github:https://github.com/MichaelBeechan    博主CSDN:https://blog.csdn.net/u011344545    計算機視覺資料集:https://github.com/Michael

資料整理

轉:https://blog.csdn.net/liuxiao214/article/details/78889662 一共12個人體行為識別的資料集,基於視訊的; 6個影象識別的,有關物體識別、行人識別、年齡識別和人頭檢測的,基於影象,影象識別資料集參考於部落格:http://blog.c

【活體檢測】人臉活體檢測、紅外人臉資料整理

此篇部落格主要整理人臉活體檢測的資料集。 目前人臉活體攻擊的方式主要有:照片列印、視訊回放攻擊、3D人臉面具等。因此資料集也是根據這些攻擊方式製作的。 一共整理了11個活體檢測的資料集。此外還整理了6個紅外人臉資料集。 活體檢測資料集 紅外資料: IDIAP:mssp

霧天影象資料整理

D-hazy資料集 介紹瞭如何用深度圖生成霧天 使用了以下室內資料集 middlebury http://vision.middlebury.edu/stereo/data/scenes2014/ 2.NYU2 Depth https://cs.nyu.edu/~s

醫學影像開源資料

筆者是在醫療AI領域奮鬥的博士生,最近好幾位做計算機視覺的好朋友,想嘗試醫療領域的影像,Bigdata是AI的燃料,索性把自己之前的藏貨拿出來分享一下,大家一起加油! (醫學影像的分割、匹配、分類、超分辨、重建等應該都有資源) 1、Github上哈佛 beamandr

公開資料整理

2016年10月1日 為了促進計算機視覺技術的進步,谷歌釋出了Open Images,大約900萬URL的已經標註影象資料集,橫跨6000個分類。 2016年8月20日 機器學習的一個數據庫 2016年8月2日 清華大學唐傑老師課題

16個推薦系統開放公共資料整理分享

(本文由深度學習與NLP編譯) 本文主要整理了一些與推薦系統相關的高質量的資料集。整理自Stack Overflow、一些文章、推薦站點和學術實驗。其中,大多數資料集都是免費、開放的,但有些不是,需要獲得許可或引用作者的工作才能使用。此外,其中也包含一些預處理資料,可用於學

計算機視覺標準資料整理—PASCAL VOC資料

資料集下載 PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge。此資料集可以用於影象分類、目標檢測、影象分割。 資料集下載映象地址如下(包括VOC2007和VOC2012):

計算機視覺標準資料整理—CIFAR-100資料

CIFAR-100資料集(用作100類的影象分類) 這個資料集和CIFAR-10相比,它具有100個類,大約600張/類,每類500張訓練,500張測試; 這100類又可以grouped成20

計算機視覺標準資料整理—COCO資料

COCO資料集由微軟贊助,其對於影象的標註資訊不僅有類別、位置資訊,還有對影象的語義文字描述,COCO資料集的開源使得近兩三年來影象分割語義理解取得了巨大的進展,也幾乎成為了影象語義理解演算法效能評價的“標準”資料集。Google的開源show and tell生成模型就是在此資料集上測試的。  這個資料

NLP 資料整理(持續更新。。。)

這篇文章總結了我看到的NLP相關論文中使用的語料資料,將會持續更新。小夥伴們如果也知道文中沒有的資料集,歡迎大家在評論中告訴我~只要寫資料集的名字,對應文章和下載網址就可以,我看到會第一時間新增到本文中^.^ 用於NLP實驗的各類免費英文語料資料庫整理如下:(

表情識別資料整理

CK and CK+ It contains 97 subjects, which posed in a lab situation for the six universal expressions and the neutral expression.

UCI資料整理(附論文常用資料

摘要:UCI資料集作為標準測試資料集經常出現在許多機器學習的論文中,為了更方便使用這些資料集有必要對其進行整理,這裡整理了論文中經常出現的資料集,並詳細介紹如何使用MATLAB將資料集檔案整理成自己需

機器視覺中常用開源資料和免費標註工具

科技巨頭如Google,微軟,亞馬遜等都紛紛宣佈在AI領域佈局,AI的影響隨著深度學習的應用日益深入。機器視覺作為一個熱門子領域,無論是在傳統金融行業還是最新自動駕駛領域都掀起了一股學習應用的浪潮。這是多麼棒的一件事啊!但是我們應該如何簡單的開始研究機器視覺?以下是幾個主要的

影象處理開源資料

(1)手寫數字識別 訓練集:60000個 測試集:10000個 下載連結:http://yann.lecun.com/exdb/mnist/   (2)貓狗分類 下載連結:https://www.kaggle.com/c/dogs-vs-cats/data    (3