資料集整理
轉:https://blog.csdn.net/liuxiao214/article/details/78889662
一共12個人體行為識別的資料集,基於視訊的;
6個影象識別的,有關物體識別、行人識別、年齡識別和人頭檢測的,基於影象,影象識別資料集參考於部落格:http://blog.csdn.net/qq_14845119/article/details/51913171
後續可能還會補充。
視訊識別
1、Weizmann
內容:
1、10個類別,每個類別9個視訊,背景單一。
2、180x144
下載連結: http://www.wisdom.weizmann.ac.il/~vision/SpaceTimeActions.html
2、KTH
內容:
1、共25個人採集,6個類別,每個類別4個情境,3中室外,1種室內,共600個視訊。
2、給出了每個視訊4個片段的始末幀位置。
3、規格:160x120,25fps。
下載連結: http://www.nada.kth.se/cvap/actions/
3、Fire Detection
內容: 共6個視訊,火災檢測。
下載連結: http://crcv.ucf.edu/data/fire.php
4、UCF101
內容:
1、共13320個視訊101個類別,從YouTube採集的真實場景。
2、分為5大類:人與物互動、baby動作、人人互動、樂器演奏、運動。
3、規格:320x240,25fps,最小視訊為28幀。
下載連結: http://crcv.ucf.edu/data/UCF101.php
5、HMDB51
內容:
1、共51個類別,6849個視訊。每一個類別至少包含101個視訊。
2、從電影、視訊網站上採集。
3、包含5大類:面部動作(微笑、大笑、咀嚼、說話);面部與物互動動作(吃飯、喝水、抽菸);身體運動(翻跟斗、拍手、爬上等);身體與物互動運動(梳頭髮、拔劍等);人人互動運動(擊劍、擁抱、接吻等)
下載連結: http://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/#dataset
6、VISAL
內容:
1、包含很多資料集,船隻資料、紋理合成資料、交通擁擠資料、擁擠人群資料UCSD(行人、人註釋、人數、線劃分)、人3D姿態資料MADS。
2、可下載擁擠人群和人姿態。
下載連結: http://visal.cs.cityu.edu.hk/downloads/
7、Monitoring Human Activity
內容:
1、資料量很小,且需要單獨下載,有空可下載。
下載連結: http://mha.cs.umn.edu/index.shtml
8、HOLLYWOOD2
內容:
1、人體動作:12個類別。
2、場景:10個類別。
3、共3669個視訊,20.1個小時。
4、從69部電影中採集。
5、視訊樣本中行為人的表情、姿態、穿著,以及相機運動、光照變化、遮擋、背景等變化很大,接近於真實場景下的情況,因而對於行為的分析識別極具挑戰性。
下載連結: http://www.di.ens.fr/~laptev/actions/hollywood2/
9、YouTube-8M
內容:
1、800萬個標註視訊,每個視訊120s到500s。
下載連結: https://research.google.com/youtube8m/
10、Moments in Time Dataset
內容:
1、100萬個標註視訊,每個視訊3秒。
下載連結: http://moments.csail.mit.edu/
11、TRECVID
內容:
如何下載,沒看明白,暫時先不管。
下載連結: http://www-nlpir.nist.gov/projects/tv2008/tv2008.html#1
12、CMU Graphics Lab Motion Capture Database
內容:
應該是一些骨骼點動作捕捉,下載連結分散,很難下載,需要寫指令碼。
下載連結: http://mocap.cs.cmu.edu/
影象識別
1、ImageNet
內容: 物體識別
ImageNet是一個計算機視覺系統識別專案,是目前世界上影象識別最大的資料庫。是美國斯坦福的電腦科學家李飛飛模擬人類的識別系統建立的。能夠從圖片識別物體。目前已經包含14197122張影象,是已知的最大的影象資料庫。
下載連結: http://www.image-net.org/
2、CIFAR
內容: 物體識別
CIFAR-100由60000張影象構成,包含100個類別,每個類別600張影象,其中500張用於訓練,100張用於測試。其中這100個類別又組成了20個大的類別,每個影象包含小類別和大類別兩個標籤。官網提供了Matlab,C,python三個版本的資料格式。
下載連結: http://www.cs.toronto.edu/~kriz/cifar.html
3、INRIA Person Dataset
內容: 行人檢測
Inria資料集是最常使用的行人檢測資料集。其中正樣本(行人)為png格式,負樣本為jpg格式。裡面的圖片分為只有車,只有人,有車有人,無車無人四個類別。圖片畫素為70*134,96*160,64*128等。
下載連結: http://pascal.inrialpes.fr/data/human/
4、CaltechPedestrian Detection Benchmark
內容: 行人識別
下載連結: http://www.vision.caltech.edu/Image_Datasets/CaltechPedestrians/
5、Adience
內容: 性別年齡識別
該資料集來源為Flickr相簿,由使用者使用iPhone5或者其它智慧手機裝置拍攝,同時具有相應的公眾許可。該資料集主要用於進行年齡和性別的未經過濾的面孔估計。同時,裡面還進行了相應的landmark的標註。是做性別年齡估計和人臉對齊的一個數據集。圖片包含2284個類別和26580張圖片。
下載連結: http://www.openu.ac.il/home/hassner/Adience/data.html#agegender
6、HollywoodHeads dataset
內容: 人頭檢測
該資料集為從視訊中擷取的圖片,包含224740張jpeg格式圖片,還有xml格式的標註,和VOC的標註方式一樣。
下載連結: http://www.di.ens.fr/willow/research/headdetection/release/HollywoodHeads.zip