轉發--目前開源資料集整理

阿新 • • 發佈：2019-01-17

---------------------

本文來自忘情擺渡的CSDN 部落格，全文地址請點選：https://blog.csdn.net/wangqingbaidu/article/details/80635618?utm_source=copy

Attention!

我的Dr.Sure專案正式上線了，主旨在分享學習Tensorflow以及DeepLearning中的一些想法。期間隨時更新我的論文心得以及想法。

Images Analysis

資料集	介紹	備註	網址
Flickr30k	圖片描述	31,783 images，每張圖片5個語句標註	連結
Microsoft COCO	圖片描述	330,000 images,每張圖片至少5個語句標註	連結
ESP Game	多標籤定義影象	20,770 images，268 tags，諸如bed, light man,music	連結
IAPRTC-12	多標籤定義影象	19,452 images,291 tags	連結
NUS-WIDE	多標籤定義影象	269,648 images,several tags (2-5 on average) per image	連結
CUHK-PEDES	以文搜圖	34,054 images，每張圖片2條描述	連結
VRD	視覺關係檢測	5,000 images, 100目錄，37,993對關係	連結
sVG	視覺關係檢測	108,000 images, 998,000對關係	連結
Visual Genome Dataset	影象屬性檢測	108,077 images, 5.4 M 區域塊，2.8 M 屬性，2.3 M 關係	連結
VQA	問答系統	1,105,904問題，11,059,040 回答	連結
Visual7W	問答系統	327,939 問答對	連結
TID2013	影象質量評價	25張參考影象，24個失真型別	連結
CSIQ	影象質量評價	30張參考影象，6個失真型別	連結
LIVE	影象質量評價	29張參考影象，5個失真型別	連結
WATERLOO	影象質量評價	4744張參考影象，20個失真型別	連結
photo.net	影象美觀評價	20,278張影象，打分[0,10]	連結
DPChallenge.com	影象美觀評價	16,509張影象，打分[0,10]	連結
CUHK	影象美觀評價	28,410張影象，只分高質量和低質量	連結
AVA	影象美觀評價	255,500張影象，打分[0,10]	連結

Image Motion & Tracking

資料集	介紹	備註	網址
CUHK03	Person re-identification(人重識別)	image num:13164 person num:1360 camera num:10( 5 pairs)	連結
CUHK02	Person re-identification(人重識別)	image num:7264 person num:1816 camera num:10( 5 pairs)	連結
CUHK01	Person re-identification(人重識別)	image num:3884 person num:971 camera num: 2	連結
VIPeR	Person re-identification(人重識別)	image num:1264 person num:632 camera num:2	連結
ETH1,2,3	Person re-identification(人重識別)	image num:8580 person num:83,35,28 camera num:1	連結
PRID2011	Person re-identification(人重識別)	image num:24541 person num:934 camera num:2	連結
MARS	Person re-identification(人重識別)	image num:11910031 person num:1261 camera num:6	連結
Market1501	Person re-identification(人重識別)	image num:32217 person num:1501 camera num:6	連結
Epic Fail (EF) dataset	Risk Assessment(風險評估)	video num:3000	連結
Street Accident (SA) dataset	Risk Assessment(風險評估)	video num:1733	連結
OTB-50	visual tracking(跟蹤)	video num:50	連結
OTB-100	visual tracking(跟蹤)	video num:100	連結
VOT2015	visual tracking(跟蹤)	video num:60	連結
ALOV300	visual tracking(跟蹤)	video num:314	連結
MOT	visual tracking(跟蹤)	video num:train:11 test:11	連結
THUMOS	Temporal action localization(動作定位)	video num:~3K activities class:20 instances:~3K	連結
ActivityNet	Temporal action localization(動作定位)	video num:20k activities class:200 instances:7.6K	連結
Mexaction2	Temporal action localization(動作定位)	activities class:2 instances:1975	連結
FlyingChairs dataset	optical flow(光流)	image pairs：22k	連結
FlyingThings3D	optical flow(光流)	image pairs：22k	連結
KITTI benchmark suite	optical flow(光流)	image pairs：1600	連結
MPI Sintel	optical flow(光流)	image pairs：1064	連結

Video Analysis & Scene Understanding

資料集	介紹	備註	網址
UCF101	動作行為識別	13320 video,101類動作，主要是五大類：1)人-物互動；2)肢體運動；3)人-人互動；4)彈奏樂器；5)運動	連結
HMDB51	動作行為識別	7000 videos,51類，包括人臉表情動作，身體動作，人與人互動等	連結
Moments-in-Time	動作行為識別	1,000,000 videos,339類	連結
ActivityNet 1.3	動作行為識別	20,000 videos,200類	連結
Kinetics	動作行為識別	300,000 videos，400類	連結
AVA	動作行為識別	57,600 videos，80類	連結
Collective Activity Dataset	群體活動行為識別	44 videos,穿叉、行走、等待、交談和排隊五類	連結
Choi’s New Dataset	群體活動行為識別	32 videos，聚會，談話，分開，一起走，追逐和排隊六類	None
ActivityNet 1.3	檢測動作事件的起始時間和終止時間	20,000 videos,200類動作的起始時間和終止時間	連結
THUMOS	檢測動作事件的起始時間和終止時間	15,000 videos，101類動作的起始時間和終止時間	連結
MED	事件檢測	32,744 videos,20個事件	連結
EventNet	事件檢測	90,000 videos，500個事件	連結
Columbia Consumer Video	事件檢測	9,317 videos，20個事件	連結
ADE20K	事件檢測	20,210 videos，900個事件	連結
DAVIS	視訊主物體分割	50 videos，分割標註	連結
FBMS	視訊主物體分割	59 videos，分割標註	連結
IJB-C	視訊人臉識別	11,000 videos，	連結
YouTube Faces	視訊人臉識別	3,425 videos，1595 人	連結
MS-Celeb-1M	視訊人臉識別	1,000,000 images，21,000人	連結
MSVD	視訊描述	1,970 videos	連結
MSR-VTT-10K	視訊描述	10，000 videos	連結
MSR-VTT-10K	視訊描述	無	連結

3D Computer Vision

資料集	介紹	備註	網址
photoface database	基於光度立體視覺的二維和三維人臉識別資料庫	總共7356張影象，包含1839個session和261個subjects	None
NYU Depth V2 dataset	關於RGBD 影象場景理解的資料庫	提供1449張深度圖片和他們的密集2d點類標註	連結
SUN RGBD dataset	是上面的NYU Depth V2 dataset的超集，多了3D bounding boxes和room layouts的標註。	有10,000張RGB-D圖片，有58,657個3D包圍框和146,617 個2d包圍框。	連結
PASCAL3D+	新的三維物體檢測和姿態估計資料集，從PASCAL VOC 演化而來，包含影象，註解，和3D CAD模型	總共12個類，平均每個類別有3000多個例項	連結
IKEA	包含典型室內場景的三維模型的資料庫，例如桌子椅子等	包含大約759張圖片和219個3D模型	連結
New Tsukuba Dataset	包含了很多立體物體對的資料庫，用於立體物體匹配	總共1800個立體物體對，以及每立體對的立體視差圖、遮擋圖和不連續圖	連結
Oxford RobotCar Dataset	關於戶外自動駕駛的資料集。	包含在駕駛汽車過程從6個攝像頭收集的2000w張圖片，和當時的鐳射雷達，GPS和地面實況標註。	連結
Middlebury V3	包含高解析度物體立體視差標註的資料庫	包含33個類，沒有明說每類有多少資料	連結
ShapeNet	包含3D模型，和3d模型的類別標註的資料集，覆蓋了常用的3D資料集PASCAL 3D+。	它涵蓋55個常見的物件類別，有大約51,300個3D模型	連結
MICC dataset	包含了3D人臉掃描和在不同解析度，條件和縮放級別下的幾個視訊序列的資料庫。	有53個人的立體人臉資料	連結
CMU MoCap Dataset	包含了3D人體關鍵點標註和骨架移動標註的資料集。	有6個類別和23個子類別，總共2605個數據。	連結
DTU dataset	關於3D場景的資料集。	有124個場景，每場景有49/64個位置的RGB影象和結構光標註。	連結

Analyzing Humans in Images

資料集	介紹	備註	網址
MSR-Action3D	包含深度的動作識別資料集，	有20個動作，總共557個序列。	連結
Florence-3D	包含深度的動作識別資料集，	有9個動作，總共215個動作序列。	連結
Berkeley MHAD	包含深度的動作識別資料集，	有11個動作，產生660個動作序列。	連結
Online Action Detection	包含深度的動作識別資料集，	資料集包含59個長序列，包含10種不同的日常生活行為。	連結
ChaLearn LAP IsoGD Dataset	RGB-D影象的手勢識別的資料集。	包括47933個RGB-D手勢視訊，有249個手勢標籤。Training有35878視訊，Validation有5784個，test有6271個	連結
MAFA dataset	關於面部遮擋問題的資料集	有30, 811張人臉和35806張有遮擋的臉組成。	連結
MSRC-12 Kinect Gesture Dataset	手勢識別資料集	有4900張圖片，包含12個不同手勢，	連結
2013 Chalearn Gesture Challenge dataset	手勢識別資料集	有11000張圖片，包含20個不同手勢，	連結
WIDER FACE	人臉檢測資料集	有 32,203 張圖片，標註了393703個人臉。	連結
FDDB	人臉檢測資料集	2845張圖片，標註了5171張人臉。	連結
300-VW dataset	面部表情資料集	包含114個視訊和總計218,595幀。	連結
HMDB51	人類行為識別的資料集	包含51個動作，總共有6766個視訊剪輯	連結
MPII Cooking Activities Dataset	人類行為識別的資料集	包含65個動作，有5609個視訊	連結
UCF101	人類行為識別的資料集	包含101個動作，有13320個視訊	連結
IJB-A dataset	包含視訊和圖片人臉識別的資料集	包含5712個影象和2085個視訊	連結
YouTube celebrities	視訊人臉識別的資料集	包含47位名人的1910個視訊	連結
COX	視訊人臉識別的資料集	包含1000個主題的4000個視訊	連結
Human3.6M	人體姿態估計的資料集	360萬張3D照片，11名受試者在4個視點下執行15個了不同的動作	連結
iLIDS	行人重識別的資料集	476 張影象，包含119個人	連結
VIPeR	行人重識別的資料集	632個行人圖片對（由兩個相機拍攝）	連結
CUHK01	行人重識別的資料集	包含971行人, 3884張圖片	連結
CUHK03	行人重識別的資料集	包含1360行人, 13164張圖片	連結
RWTH-PHOENIX-Weather multi-signer 2014	手語識別的資料集	包含了5672個德語手語的句子，有65,227個手語姿勢和799,006幀	連結
AFLW	人類面部關鍵點的資料集	總共約有25k張臉，每幅影象標註了大約21個位置。	連結
CMU mocap database	動作識別的資料集	2235個數據，包含144個不同的動作。	連結
Georgia Tech (GT) database	人臉識別資料庫	50個人每人15張人臉。	連結
ORL	人臉識別資料庫	40個人每個人10張圖。	連結

Application

資料集	介紹	備註	網址
DogCentric Activity Dataset	第一視角的狗和人之間的相互行為的資料集（視訊）	總共有10類，具體資料量沒有明說，y是動作類別	連結
JPL First-Person Interaction Dataset	第一視角觀察動作的資料集	57個視訊，8個大類，y是動作類別	連結
NUS-WIDE	關於影象文字匹配的資料集	269,648個影象和對應的標籤	連結
LabelMe Dataset	關於影象文字匹配的資料集	3825個影象和對應標籤	連結
Pascal Dataset	關於影象文字匹配的資料集	5011張訓練影象和4952張測試影象	)
ICDAR 2015	關於文字檢測的資料集	1500張訓練，1000張測試，y為四邊形的四個頂點。	連結
COCO-Text	關於文字檢測的資料集	63686張圖片，其中43686張被選為訓練集，剩下的2萬用於測試。	連結
MSRA-TD500	關於文字檢測的資料集	300個訓練，200個測試影象	連結
Microsoft 7-Scenes Dataset	室內人體運動的資料集	有7種不同室內環境，每包含500-1000張影象視訊序列。	連結
Oxford RobotCar	戶外自動駕駛資料集	包含影象，鐳射掃描結果和GPS資料。	連結

Low- & Mid-Level Vision

資料集	介紹	備註	網址
Deep Video Deblurring for Hand-held Cameras	video/image deblurring(影象去模糊)	video num:71 video time: 3-5s blurry and sharp pair image num:6708	連結
GOPRO dataset	video/image deblurring(影象去模糊)	blurry and sharp pair image num:3214 train num:2103 test num:1111	連結
BSD68	image restoration(影象修復)/高斯降噪	image num:68	連結
BSD100	“image restoration(影象修復)super resolution超解析度重建”	image num:100	連結
Set5	“image restoration(影象修復)super resolution超解析度重建”	image num:5	連結
Set14	“image restoration(影象修復)super resolution超解析度重建”	image num:14	連結
Urban100	“image restoration(影象修復)super resolution超解析度重建”	image num:100	連結
NYU v2 dataset	“image restoration(影象修復)depth super resolution深度超解析度重建”	image num:1449	連結
Middlebury dataset	“image restoration(影象修復)depth super resolution深度超解析度重建”	image pair num: 33	連結
alpha matting benchmark	Natural image matting(摳圖)	“train num:27,test num:8”	連結
real image benchmark	Natural image matting(摳圖)	“train num:49300,test num:1000”	連結
MSRA10K/MSRA-B	Image saliency detection(顯著性區域檢測)	image num(MSRA10K):10000 image num(MSRA-B):5000	連結
ECSSD	Image saliency detection(顯著性區域檢測)	image num:1000	連結
DUT-OMRON	Image saliency detection(顯著性區域檢測)	image num:5168	連結
PASCAL-S	Image saliency detection(顯著性區域檢測)	image num:850	連結
HKU-IS	Image saliency detection(顯著性區域檢測)	image num:4447	連結
SOD	Image saliency detection(顯著性區域檢測)	image num:300	連結
Describable Textures Dataset	texture synthesis(紋理合成)	image num:5640 category num:47 split train:val:test = 1:1:1	連結
CVPPP leaf segmentation	Instance segmentation(樣例分割)	image num: 161 train num: 128 test num: 33	連結
KITTI car segmentation	Instance segmentation(樣例分割)	image num: 3976 train num: 3712 test num: 144 val:120	連結
Cityscapes	Instance segmentation(樣例分割)	image num: 5000 train num: 2975 test num: 1525 val:500	連結
SYMMAX	Symmetry Detection(對稱性檢測)	image num: train:200 test:100	連結
WHSYMMAX	Symmetry Detection(對稱性檢測)	image num: train:228 test:100 object num: 1	連結
SK506	Symmetry Detection(對稱性檢測)	image num: train:300 test:206 object num: 16	連結
Sym-PASCAL	Symmetry Detection(對稱性檢測)	image num: train:648 test:787 object num: 14	連結
Color Checker Dataset	Color constancy(顏色恆定)	image num: 568	連結
NUS 8-Camera Dataset	Color constancy(顏色恆定)	image num: 1736	連結

Text

資料集	介紹	備註	網址
Stanford Sentiment Treebank	文字情感分析	11855個句子劃分為239231個短語，每個短語有個概率值，越小越負面，越大越正面	連結
IMDB	文字情感分析	100,000句子，正面負面兩類	連結
Yelp	文字情感分析	無	連結
Multi-Domain Sentiment Dataset(Amazon product)	文字情感分析	100,000+句子，正面負面2類或強正面、弱正面、中立、弱負面、強負面5類	連結
SemEval	文字情感分析	20,632句子，三類（正面、負面、中立）	連結
Sentiment140(STS)	文字情感分析	1,600,000句子,三類（正面、負面、中立）	連結

--------------------- 本文來自忘情擺渡的CSDN 部落格，全文地址請點選：https://blog.csdn.net/wangqingbaidu/article/details/80635618?utm_source=copy

轉發--目前開源資料集整理

--------------------- 本文來自忘情擺渡的CSDN 部落格，全文地址請點選：https://blog.csdn.net/wangqingbaidu/article/details/80635618?utm_source=copy Atten

目前開源資料集整理

Attention! 我的Dr.Sure專案正式上線了，主旨在分享學習Tensorflow以及DeepLearning中的一些想法。期間隨時更新我的論文心得以及想法。 Images Analysis 資料集介紹備註

第三篇：基於深度學習的人臉特徵點檢測 - 資料集整理

https://yinguobing.com/facial-landmark-localization-by-deep-learning-data-collate/ 在上一篇博文中，我們已經下載到了包括300-W、LFPW、HELEN、AFW、IBUG和300-VW在內的6個數據集，初步估算有2

機器學習、深度學習開源資料集分享

轉自：機器學習演算法與Python學習機器學習演算法與Python學習微訊號guodongwei1991 功能介紹作為溝通學習的平臺，釋出機器學習與資料探勘、深度學習、Python實戰的前沿與動態，歡迎機器學習愛好者的加入，希望幫助你在AI領域更好的發展，期待與你相遇！今天

【資料集整理】人體行為識別和影象識別

原連結：https://blog.csdn.net/liuxiao214/article/details/78889662 謝謝博主的整理，轉載一下以便查閱。一共12個人體行為識別的資料集，基於視訊的； 6個影象識別的，有關物體識別、行人識別、年齡識別和人頭檢測的，基

資料集 | 開源資料集（計算機視覺影象、定位、識別）

博主github：https://github.com/MichaelBeechan 博主CSDN：https://blog.csdn.net/u011344545 計算機視覺資料集：https://github.com/Michael

資料集整理

轉：https://blog.csdn.net/liuxiao214/article/details/78889662 一共12個人體行為識別的資料集，基於視訊的； 6個影象識別的，有關物體識別、行人識別、年齡識別和人頭檢測的，基於影象，影象識別資料集參考於部落格：http://blog.c

【活體檢測】人臉活體檢測、紅外人臉資料集整理

此篇部落格主要整理人臉活體檢測的資料集。目前人臉活體攻擊的方式主要有：照片列印、視訊回放攻擊、3D人臉面具等。因此資料集也是根據這些攻擊方式製作的。一共整理了11個活體檢測的資料集。此外還整理了6個紅外人臉資料集。活體檢測資料集紅外資料： IDIAP：mssp

霧天影象資料集整理

D-hazy資料集介紹瞭如何用深度圖生成霧天使用了以下室內資料集 middlebury http://vision.middlebury.edu/stereo/data/scenes2014/ 2.NYU2 Depth https://cs.nyu.edu/~s

醫學影像開源資料集

筆者是在醫療AI領域奮鬥的博士生，最近好幾位做計算機視覺的好朋友，想嘗試醫療領域的影像，Bigdata是AI的燃料，索性把自己之前的藏貨拿出來分享一下，大家一起加油！（醫學影像的分割、匹配、分類、超分辨、重建等應該都有資源） 1、Github上哈佛 beamandr

公開資料集整理

2016年10月1日為了促進計算機視覺技術的進步，谷歌釋出了Open Images，大約900萬URL的已經標註影象資料集，橫跨6000個分類。 2016年8月20日機器學習的一個數據庫 2016年8月2日清華大學唐傑老師課題

16個推薦系統開放公共資料集整理分享

（本文由深度學習與NLP編譯）本文主要整理了一些與推薦系統相關的高質量的資料集。整理自Stack Overflow、一些文章、推薦站點和學術實驗。其中，大多數資料集都是免費、開放的，但有些不是，需要獲得許可或引用作者的工作才能使用。此外，其中也包含一些預處理資料，可用於學

計算機視覺標準資料集整理—PASCAL VOC資料集

資料集下載 PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集，從2005年到2012年每年都會舉行一場影象識別challenge。此資料集可以用於影象分類、目標檢測、影象分割。資料集下載映象地址如下（包括VOC2007和VOC2012）：

計算機視覺標準資料集整理—CIFAR-100資料集

CIFAR-100資料集（用作100類的影象分類）這個資料集和CIFAR-10相比，它具有100個類，大約600張/類，每類500張訓練，500張測試；這100類又可以grouped成20

計算機視覺標準資料集整理—COCO資料集

COCO資料集由微軟贊助，其對於影象的標註資訊不僅有類別、位置資訊，還有對影象的語義文字描述，COCO資料集的開源使得近兩三年來影象分割語義理解取得了巨大的進展，也幾乎成為了影象語義理解演算法效能評價的“標準”資料集。Google的開源show and tell生成模型就是在此資料集上測試的。這個資料

NLP 資料集整理(持續更新。。。)

這篇文章總結了我看到的NLP相關論文中使用的語料資料，將會持續更新。小夥伴們如果也知道文中沒有的資料集，歡迎大家在評論中告訴我~只要寫資料集的名字，對應文章和下載網址就可以，我看到會第一時間新增到本文中^.^ 用於NLP實驗的各類免費英文語料資料庫整理如下：(

表情識別資料集整理

CK and CK+ It contains 97 subjects, which posed in a lab situation for the six universal expressions and the neutral expression.

UCI資料集整理（附論文常用資料集）

摘要：UCI資料集作為標準測試資料集經常出現在許多機器學習的論文中，為了更方便使用這些資料集有必要對其進行整理，這裡整理了論文中經常出現的資料集，並詳細介紹如何使用MATLAB將資料集檔案整理成自己需

機器視覺中常用開源資料集和免費標註工具

科技巨頭如Google,微軟，亞馬遜等都紛紛宣佈在AI領域佈局，AI的影響隨著深度學習的應用日益深入。機器視覺作為一個熱門子領域，無論是在傳統金融行業還是最新自動駕駛領域都掀起了一股學習應用的浪潮。這是多麼棒的一件事啊！但是我們應該如何簡單的開始研究機器視覺？以下是幾個主要的

影象處理開源資料集

（1）手寫數字識別訓練集：60000個測試集：10000個下載連結：http://yann.lecun.com/exdb/mnist/ （2）貓狗分類下載連結：https://www.kaggle.com/c/dogs-vs-cats/data （3

轉發--目前開源資料集整理

---------------------

本文來自 忘情擺渡 的CSDN 部落格 ，全文地址請點選：https://blog.csdn.net/wangqingbaidu/article/details/80635618?utm_source=copy

Attention!

Images Analysis

Image Motion & Tracking

Video Analysis & Scene Understanding

3D Computer Vision

Analyzing Humans in Images

Application

Low- & Mid-Level Vision

Text

相關推薦

本文來自忘情擺渡的CSDN 部落格，全文地址請點選：https://blog.csdn.net/wangqingbaidu/article/details/80635618?utm_source=copy