轉發--目前開源資料集整理
---------------------
本文來自 忘情擺渡 的CSDN 部落格 ,全文地址請點選:https://blog.csdn.net/wangqingbaidu/article/details/80635618?utm_source=copy
Attention!
我的Dr.Sure專案正式上線了,主旨在分享學習Tensorflow以及DeepLearning中的一些想法。期間隨時更新我的論文心得以及想法。
Images Analysis
資料集 | 介紹 | 備註 | 網址 |
---|---|---|---|
Flickr30k | 圖片描述 | 31,783 images,每張圖片5個語句標註 | 連結 |
Microsoft COCO | 圖片描述 | 330,000 images,每張圖片至少5個語句標註 | 連結 |
ESP Game | 多標籤定義影象 | 20,770 images,268 tags,諸如bed, light man,music | 連結 |
IAPRTC-12 | 多標籤定義影象 | 19,452 images,291 tags | 連結 |
NUS-WIDE | 多標籤定義影象 | 269,648 images,several tags (2-5 on average) per image | 連結 |
CUHK-PEDES | 以文搜圖 | 34,054 images,每張圖片2條描述 | 連結 |
VRD | 視覺關係檢測 | 5,000 images, 100目錄,37,993對關係 | 連結 |
sVG | 視覺關係檢測 | 108,000 images, 998,000對關係 | 連結 |
Visual Genome Dataset | 影象屬性檢測 | 108,077 images, 5.4 M 區域塊,2.8 M 屬性,2.3 M 關係 | 連結 |
VQA | 問答系統 | 1,105,904問題,11,059,040 回答 | 連結 |
Visual7W | 問答系統 | 327,939 問答對 | 連結 |
TID2013 | 影象質量評價 | 25張參考影象,24個失真型別 | 連結 |
CSIQ | 影象質量評價 | 30張參考影象,6個失真型別 | 連結 |
LIVE | 影象質量評價 | 29張參考影象,5個失真型別 | 連結 |
WATERLOO | 影象質量評價 | 4744張參考影象,20個失真型別 | 連結 |
photo.net | 影象美觀評價 | 20,278張影象,打分[0,10] | 連結 |
DPChallenge.com | 影象美觀評價 | 16,509張影象,打分[0,10] | 連結 |
CUHK | 影象美觀評價 | 28,410張影象,只分高質量和低質量 | 連結 |
AVA | 影象美觀評價 | 255,500張影象,打分[0,10] | 連結 |
Image Motion & Tracking
資料集 | 介紹 | 備註 | 網址 |
---|---|---|---|
CUHK03 | Person re-identification(人重識別) | image num:13164 person num:1360 camera num:10( 5 pairs) | 連結 |
CUHK02 | Person re-identification(人重識別) | image num:7264 person num:1816 camera num:10( 5 pairs) | 連結 |
CUHK01 | Person re-identification(人重識別) | image num:3884 person num:971 camera num: 2 | 連結 |
VIPeR | Person re-identification(人重識別) | image num:1264 person num:632 camera num:2 | 連結 |
ETH1,2,3 | Person re-identification(人重識別) | image num:8580 person num:83,35,28 camera num:1 | 連結 |
PRID2011 | Person re-identification(人重識別) | image num:24541 person num:934 camera num:2 | 連結 |
MARS | Person re-identification(人重識別) | image num:11910031 person num:1261 camera num:6 | 連結 |
Market1501 | Person re-identification(人重識別) | image num:32217 person num:1501 camera num:6 | 連結 |
Epic Fail (EF) dataset | Risk Assessment(風險評估) | video num:3000 | 連結 |
Street Accident (SA) dataset | Risk Assessment(風險評估) | video num:1733 | 連結 |
OTB-50 | visual tracking(跟蹤) | video num:50 | 連結 |
OTB-100 | visual tracking(跟蹤) | video num:100 | 連結 |
VOT2015 | visual tracking(跟蹤) | video num:60 | 連結 |
ALOV300 | visual tracking(跟蹤) | video num:314 | 連結 |
MOT | visual tracking(跟蹤) | video num:train:11 test:11 | 連結 |
THUMOS | Temporal action localization(動作定位) | video num:~3K activities class:20 instances:~3K | 連結 |
ActivityNet | Temporal action localization(動作定位) | video num:20k activities class:200 instances:7.6K | 連結 |
Mexaction2 | Temporal action localization(動作定位) | activities class:2 instances:1975 | 連結 |
FlyingChairs dataset | optical flow(光流) | image pairs:22k | 連結 |
FlyingThings3D | optical flow(光流) | image pairs:22k | 連結 |
KITTI benchmark suite | optical flow(光流) | image pairs:1600 | 連結 |
MPI Sintel | optical flow(光流) | image pairs:1064 | 連結 |
Video Analysis & Scene Understanding
資料集 | 介紹 | 備註 | 網址 |
---|---|---|---|
UCF101 | 動作行為識別 | 13320 video,101類動作,主要是五大類:1)人-物互動;2)肢體運動;3)人-人互動;4)彈奏樂器;5)運動 | 連結 |
HMDB51 | 動作行為識別 | 7000 videos,51類,包括人臉表情動作,身體動作,人與人互動等 | 連結 |
Moments-in-Time | 動作行為識別 | 1,000,000 videos,339類 | 連結 |
ActivityNet 1.3 | 動作行為識別 | 20,000 videos,200類 | 連結 |
Kinetics | 動作行為識別 | 300,000 videos,400類 | 連結 |
AVA | 動作行為識別 | 57,600 videos,80類 | 連結 |
Collective Activity Dataset | 群體活動行為識別 | 44 videos,穿叉、行走、等待、交談和排隊 五類 | 連結 |
Choi’s New Dataset | 群體活動行為識別 | 32 videos,聚會,談話,分開,一起走,追逐和排隊 六類 | None |
ActivityNet 1.3 | 檢測動作事件的起始時間和終止時間 | 20,000 videos,200類動作的起始時間和終止時間 | 連結 |
THUMOS | 檢測動作事件的起始時間和終止時間 | 15,000 videos,101類動作的起始時間和終止時間 | 連結 |
MED | 事件檢測 | 32,744 videos,20個事件 | 連結 |
EventNet | 事件檢測 | 90,000 videos,500個事件 | 連結 |
Columbia Consumer Video | 事件檢測 | 9,317 videos,20個事件 | 連結 |
ADE20K | 事件檢測 | 20,210 videos,900個事件 | 連結 |
DAVIS | 視訊主物體分割 | 50 videos,分割標註 | 連結 |
FBMS | 視訊主物體分割 | 59 videos,分割標註 | 連結 |
IJB-C | 視訊人臉識別 | 11,000 videos, | 連結 |
YouTube Faces | 視訊人臉識別 | 3,425 videos,1595 人 | 連結 |
MS-Celeb-1M | 視訊人臉識別 | 1,000,000 images,21,000人 | 連結 |
MSVD | 視訊描述 | 1,970 videos | 連結 |
MSR-VTT-10K | 視訊描述 | 10,000 videos | 連結 |
MSR-VTT-10K | 視訊描述 | 無 | 連結 |
3D Computer Vision
資料集 | 介紹 | 備註 | 網址 |
---|---|---|---|
photoface database | 基於光度立體視覺的二維和三維人臉識別資料庫 | 總共7356張影象,包含1839個session和261個subjects | None |
NYU Depth V2 dataset | 關於RGBD 影象場景理解的資料庫 | 提供1449張深度圖片和他們的密集2d點類標註 | 連結 |
SUN RGBD dataset | 是上面的NYU Depth V2 dataset的超集,多了3D bounding boxes和room layouts的標註。 | 有10,000張RGB-D圖片,有58,657個3D包圍框和146,617 個2d包圍框。 | 連結 |
PASCAL3D+ | 新的三維物體檢測和姿態估計資料集,從PASCAL VOC 演化而來,包含影象,註解,和3D CAD模型 | 總共12個類,平均每個類別有3000多個例項 | 連結 |
IKEA | 包含典型室內場景的三維模型的資料庫,例如桌子椅子等 | 包含大約759張圖片和219個3D模型 | 連結 |
New Tsukuba Dataset | 包含了很多立體物體對的資料庫,用於立體物體匹配 | 總共1800個立體物體對,以及每立體對的立體視差圖、遮擋圖和不連續圖 | 連結 |
Oxford RobotCar Dataset | 關於戶外自動駕駛的資料集。 | 包含在駕駛汽車過程從6個攝像頭收集的2000w張圖片,和當時的鐳射雷達,GPS和地面實況標註。 | 連結 |
Middlebury V3 | 包含高解析度物體立體視差標註的資料庫 | 包含33個類,沒有明說每類有多少資料 | 連結 |
ShapeNet | 包含3D模型,和3d模型的類別標註的資料集,覆蓋了常用的3D資料集PASCAL 3D+。 | 它涵蓋55個常見的物件類別,有大約51,300個3D模型 | 連結 |
MICC dataset | 包含了3D人臉掃描和在不同解析度,條件和縮放級別下的幾個視訊序列的資料庫。 | 有53個人的立體人臉資料 | 連結 |
CMU MoCap Dataset | 包含了3D人體關鍵點標註和骨架移動標註的資料集。 | 有6個類別和23個子類別,總共2605個數據。 | 連結 |
DTU dataset | 關於3D場景的資料集。 | 有124個場景,每場景有49/64個位置的RGB影象和結構光標註。 | 連結 |
Analyzing Humans in Images
資料集 | 介紹 | 備註 | 網址 |
---|---|---|---|
MSR-Action3D | 包含深度的動作識別資料集, | 有20個動作,總共557個序列。 | 連結 |
Florence-3D | 包含深度的動作識別資料集, | 有9個動作,總共215個動作序列。 | 連結 |
Berkeley MHAD | 包含深度的動作識別資料集, | 有11個動作,產生660個動作序列。 | 連結 |
Online Action Detection | 包含深度的動作識別資料集, | 資料集包含59個長序列,包含10種不同的日常生活行為。 | 連結 |
ChaLearn LAP IsoGD Dataset | RGB-D影象的手勢識別的資料集。 | 包括47933個RGB-D手勢視訊,有249個手勢標籤。Training有35878視訊,Validation有5784個,test有6271個 | 連結 |
MAFA dataset | 關於面部遮擋問題的資料集 | 有30, 811張人臉和35806張有遮擋的臉組成。 | 連結 |
MSRC-12 Kinect Gesture Dataset | 手勢識別資料集 | 有4900張圖片,包含12個不同手勢, | 連結 |
2013 Chalearn Gesture Challenge dataset | 手勢識別資料集 | 有11000張圖片,包含20個不同手勢, | 連結 |
WIDER FACE | 人臉檢測資料集 | 有 32,203 張圖片,標註了393703個人臉。 | 連結 |
FDDB | 人臉檢測資料集 | 2845張圖片,標註了5171張人臉。 | 連結 |
300-VW dataset | 面部表情資料集 | 包含114個視訊和總計218,595幀。 | 連結 |
HMDB51 | 人類行為識別的資料集 | 包含51個動作,總共有6766個視訊剪輯 | 連結 |
MPII Cooking Activities Dataset | 人類行為識別的資料集 | 包含65個動作,有5609個視訊 | 連結 |
UCF101 | 人類行為識別的資料集 | 包含101個動作,有13320個視訊 | 連結 |
IJB-A dataset | 包含視訊和圖片人臉識別的資料集 | 包含5712個影象和2085個視訊 | 連結 |
YouTube celebrities | 視訊人臉識別的資料集 | 包含47位名人的1910個視訊 | 連結 |
COX | 視訊人臉識別的資料集 | 包含1000個主題的4000個視訊 | 連結 |
Human3.6M | 人體姿態估計的資料集 | 360萬張3D照片,11名受試者在4個視點下執行15個了不同的動作 | 連結 |
iLIDS | 行人重識別的資料集 | 476 張影象,包含119個人 | 連結 |
VIPeR | 行人重識別的資料集 | 632個行人圖片對(由兩個相機拍攝) | 連結 |
CUHK01 | 行人重識別的資料集 | 包含971行人, 3884張圖片 | 連結 |
CUHK03 | 行人重識別的資料集 | 包含1360行人, 13164張圖片 | 連結 |
RWTH-PHOENIX-Weather multi-signer 2014 | 手語識別的資料集 | 包含了5672個德語手語的句子,有65,227個手語姿勢和799,006幀 | 連結 |
AFLW | 人類面部關鍵點的資料集 | 總共約有25k張臉,每幅影象標註了大約21個位置。 | 連結 |
CMU mocap database | 動作識別的資料集 | 2235個數據,包含144個不同的動作。 | 連結 |
Georgia Tech (GT) database | 人臉識別資料庫 | 50個人每人15張人臉。 | 連結 |
ORL | 人臉識別資料庫 | 40個人每個人10張圖。 | 連結 |
Application
資料集 | 介紹 | 備註 | 網址 |
---|---|---|---|
DogCentric Activity Dataset | 第一視角的狗和人之間的相互行為的資料集(視訊) | 總共有10類,具體資料量沒有明說,y是動作類別 | 連結 |
JPL First-Person Interaction Dataset | 第一視角觀察動作的資料集 | 57個視訊,8個大類,y是動作類別 | 連結 |
NUS-WIDE | 關於影象文字匹配的資料集 | 269,648個影象和對應的標籤 | 連結 |
LabelMe Dataset | 關於影象文字匹配的資料集 | 3825個影象和對應標籤 | 連結 |
Pascal Dataset | 關於影象文字匹配的資料集 | 5011張訓練影象和4952張測試影象 | ) |
ICDAR 2015 | 關於文字檢測的資料集 | 1500張訓練,1000張測試,y為四邊形的四個頂點。 | 連結 |
COCO-Text | 關於文字檢測的資料集 | 63686張圖片,其中43686張被選為訓練集,剩下的2萬用於測試。 | 連結 |
MSRA-TD500 | 關於文字檢測的資料集 | 300個訓練,200個測試影象 | 連結 |
Microsoft 7-Scenes Dataset | 室內人體運動的資料集 | 有7種不同室內環境,每包含500-1000張影象視訊序列。 | 連結 |
Oxford RobotCar | 戶外自動駕駛資料集 | 包含影象,鐳射掃描結果和GPS資料。 | 連結 |
Low- & Mid-Level Vision
資料集 | 介紹 | 備註 | 網址 |
---|---|---|---|
Deep Video Deblurring for Hand-held Cameras | video/image deblurring(影象去模糊) | video num:71 video time: 3-5s blurry and sharp pair image num:6708 | 連結 |
GOPRO dataset | video/image deblurring(影象去模糊) | blurry and sharp pair image num:3214 train num:2103 test num:1111 | 連結 |
BSD68 | image restoration(影象修復)/高斯降噪 | image num:68 | 連結 |
BSD100 | “image restoration(影象修復)super resolution超解析度重建” | image num:100 | 連結 |
Set5 | “image restoration(影象修復)super resolution超解析度重建” | image num:5 | 連結 |
Set14 | “image restoration(影象修復)super resolution超解析度重建” | image num:14 | 連結 |
Urban100 | “image restoration(影象修復)super resolution超解析度重建” | image num:100 | 連結 |
NYU v2 dataset | “image restoration(影象修復)depth super resolution深度超解析度重建” | image num:1449 | 連結 |
Middlebury dataset | “image restoration(影象修復)depth super resolution深度超解析度重建” | image pair num: 33 | 連結 |
alpha matting benchmark | Natural image matting(摳圖) | “train num:27,test num:8” | 連結 |
real image benchmark | Natural image matting(摳圖) | “train num:49300,test num:1000” | 連結 |
MSRA10K/MSRA-B | Image saliency detection(顯著性區域檢測) | image num(MSRA10K):10000 image num(MSRA-B):5000 | 連結 |
ECSSD | Image saliency detection(顯著性區域檢測) | image num:1000 | 連結 |
DUT-OMRON | Image saliency detection(顯著性區域檢測) | image num:5168 | 連結 |
PASCAL-S | Image saliency detection(顯著性區域檢測) | image num:850 | 連結 |
HKU-IS | Image saliency detection(顯著性區域檢測) | image num:4447 | 連結 |
SOD | Image saliency detection(顯著性區域檢測) | image num:300 | 連結 |
Describable Textures Dataset | texture synthesis(紋理合成) | image num:5640 category num:47 split train:val:test = 1:1:1 | 連結 |
CVPPP leaf segmentation | Instance segmentation(樣例分割) | image num: 161 train num: 128 test num: 33 | 連結 |
KITTI car segmentation | Instance segmentation(樣例分割) | image num: 3976 train num: 3712 test num: 144 val:120 | 連結 |
Cityscapes | Instance segmentation(樣例分割) | image num: 5000 train num: 2975 test num: 1525 val:500 | 連結 |
SYMMAX | Symmetry Detection(對稱性檢測) | image num: train:200 test:100 | 連結 |
WHSYMMAX | Symmetry Detection(對稱性檢測) | image num: train:228 test:100 object num: 1 | 連結 |
SK506 | Symmetry Detection(對稱性檢測) | image num: train:300 test:206 object num: 16 | 連結 |
Sym-PASCAL | Symmetry Detection(對稱性檢測) | image num: train:648 test:787 object num: 14 | 連結 |
Color Checker Dataset | Color constancy(顏色恆定) | image num: 568 | 連結 |
NUS 8-Camera Dataset | Color constancy(顏色恆定) | image num: 1736 | 連結 |
Text
資料集 | 介紹 | 備註 | 網址 |
---|---|---|---|
Stanford Sentiment Treebank | 文字情感分析 | 11855個句子劃分為239231個短語,每個短語有個概率值,越小越負面,越大越正面 | 連結 |
IMDB | 文字情感分析 | 100,000句子,正面負面兩類 | 連結 |
Yelp | 文字情感分析 | 無 | 連結 |
Multi-Domain Sentiment Dataset(Amazon product) | 文字情感分析 | 100,000+句子,正面負面2類或強正面、弱正面、中立、弱負面、強負面5類 | 連結 |
SemEval | 文字情感分析 | 20,632句子,三類(正面、負面、中立) | 連結 |
Sentiment140(STS) | 文字情感分析 | 1,600,000句子,三類(正面、負面、中立) | 連結 |
--------------------- 本文來自 忘情擺渡 的CSDN 部落格 ,全文地址請點選:https://blog.csdn.net/wangqingbaidu/article/details/80635618?utm_source=copy
相關推薦
轉發--目前開源資料集整理
--------------------- 本文來自 忘情擺渡 的CSDN 部落格 ,全文地址請點選:https://blog.csdn.net/wangqingbaidu/article/details/80635618?utm_source=copy Atten
目前開源資料集整理
Attention! 我的Dr.Sure專案正式上線了,主旨在分享學習Tensorflow以及DeepLearning中的一些想法。期間隨時更新我的論文心得以及想法。 Images Analysis 資料集 介紹 備註
第三篇:基於深度學習的人臉特徵點檢測 - 資料集整理
https://yinguobing.com/facial-landmark-localization-by-deep-learning-data-collate/ 在上一篇博文中,我們已經下載到了包括300-W、LFPW、HELEN、AFW、IBUG和300-VW在內的6個數據集,初步估算有2
機器學習、深度學習開源資料集分享
轉自:機器學習演算法與Python學習 機器學習演算法與Python學習 微訊號guodongwei1991 功能介紹作為溝通學習的平臺,釋出機器學習與資料探勘、深度學習、Python實戰的前沿與動態,歡迎機器學習愛好者的加入,希望幫助你在AI領域更好的發展,期待與你相遇! 今天
【資料集整理】人體行為識別和影象識別
原連結:https://blog.csdn.net/liuxiao214/article/details/78889662 謝謝博主的整理,轉載一下以便查閱。 一共12個人體行為識別的資料集,基於視訊的; 6個影象識別的,有關物體識別、行人識別、年齡識別和人頭檢測的,基
資料集 | 開源資料集(計算機視覺影象、定位、識別)
博主github:https://github.com/MichaelBeechan 博主CSDN:https://blog.csdn.net/u011344545 計算機視覺資料集:https://github.com/Michael
資料集整理
轉:https://blog.csdn.net/liuxiao214/article/details/78889662 一共12個人體行為識別的資料集,基於視訊的; 6個影象識別的,有關物體識別、行人識別、年齡識別和人頭檢測的,基於影象,影象識別資料集參考於部落格:http://blog.c
【活體檢測】人臉活體檢測、紅外人臉資料集整理
此篇部落格主要整理人臉活體檢測的資料集。 目前人臉活體攻擊的方式主要有:照片列印、視訊回放攻擊、3D人臉面具等。因此資料集也是根據這些攻擊方式製作的。 一共整理了11個活體檢測的資料集。此外還整理了6個紅外人臉資料集。 活體檢測資料集 紅外資料: IDIAP:mssp
霧天影象資料集整理
D-hazy資料集 介紹瞭如何用深度圖生成霧天 使用了以下室內資料集 middlebury http://vision.middlebury.edu/stereo/data/scenes2014/ 2.NYU2 Depth https://cs.nyu.edu/~s
醫學影像開源資料集
筆者是在醫療AI領域奮鬥的博士生,最近好幾位做計算機視覺的好朋友,想嘗試醫療領域的影像,Bigdata是AI的燃料,索性把自己之前的藏貨拿出來分享一下,大家一起加油! (醫學影像的分割、匹配、分類、超分辨、重建等應該都有資源) 1、Github上哈佛 beamandr
公開資料集整理
2016年10月1日 為了促進計算機視覺技術的進步,谷歌釋出了Open Images,大約900萬URL的已經標註影象資料集,橫跨6000個分類。 2016年8月20日 機器學習的一個數據庫 2016年8月2日 清華大學唐傑老師課題
16個推薦系統開放公共資料集整理分享
(本文由深度學習與NLP編譯) 本文主要整理了一些與推薦系統相關的高質量的資料集。整理自Stack Overflow、一些文章、推薦站點和學術實驗。其中,大多數資料集都是免費、開放的,但有些不是,需要獲得許可或引用作者的工作才能使用。此外,其中也包含一些預處理資料,可用於學
計算機視覺標準資料集整理—PASCAL VOC資料集
資料集下載 PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge。此資料集可以用於影象分類、目標檢測、影象分割。 資料集下載映象地址如下(包括VOC2007和VOC2012):
計算機視覺標準資料集整理—CIFAR-100資料集
CIFAR-100資料集(用作100類的影象分類) 這個資料集和CIFAR-10相比,它具有100個類,大約600張/類,每類500張訓練,500張測試; 這100類又可以grouped成20
計算機視覺標準資料集整理—COCO資料集
COCO資料集由微軟贊助,其對於影象的標註資訊不僅有類別、位置資訊,還有對影象的語義文字描述,COCO資料集的開源使得近兩三年來影象分割語義理解取得了巨大的進展,也幾乎成為了影象語義理解演算法效能評價的“標準”資料集。Google的開源show and tell生成模型就是在此資料集上測試的。 這個資料
NLP 資料集整理(持續更新。。。)
這篇文章總結了我看到的NLP相關論文中使用的語料資料,將會持續更新。小夥伴們如果也知道文中沒有的資料集,歡迎大家在評論中告訴我~只要寫資料集的名字,對應文章和下載網址就可以,我看到會第一時間新增到本文中^.^ 用於NLP實驗的各類免費英文語料資料庫整理如下:(
表情識別資料集整理
CK and CK+ It contains 97 subjects, which posed in a lab situation for the six universal expressions and the neutral expression.
UCI資料集整理(附論文常用資料集)
摘要:UCI資料集作為標準測試資料集經常出現在許多機器學習的論文中,為了更方便使用這些資料集有必要對其進行整理,這裡整理了論文中經常出現的資料集,並詳細介紹如何使用MATLAB將資料集檔案整理成自己需
機器視覺中常用開源資料集和免費標註工具
科技巨頭如Google,微軟,亞馬遜等都紛紛宣佈在AI領域佈局,AI的影響隨著深度學習的應用日益深入。機器視覺作為一個熱門子領域,無論是在傳統金融行業還是最新自動駕駛領域都掀起了一股學習應用的浪潮。這是多麼棒的一件事啊!但是我們應該如何簡單的開始研究機器視覺?以下是幾個主要的
影象處理開源資料集
(1)手寫數字識別 訓練集:60000個 測試集:10000個 下載連結:http://yann.lecun.com/exdb/mnist/ (2)貓狗分類 下載連結:https://www.kaggle.com/c/dogs-vs-cats/data (3