1. 程式人生 > >影象識別常見的資料集

影象識別常見的資料集

ImageNet(官網:http://www.image-net.org/,需要註冊才可以下載)

目前世界上影象識別最大的資料庫。美國斯坦福的電腦科學家李飛飛模擬人類的識別系統建立的。能夠從圖片識別物體。目前已經包含14197122張影象,是已知的最大的影象資料庫。每年的ImageNet大賽更是魂縈夢牽著國內外各個名校和大型IT公司以及網路巨頭的心。

在官網主頁上,點選challenge按鈕,可以選擇僅若干年的挑戰彙總(ImageNet Large Scale Visual Recognition Challenge ILSVRC)。

CIFAR(Canada Institude For Advanced Research)


由加拿大先進技術研究院的AlexKrizhevsky, Vinod Nair和Geoffrey Hinton收集而成的小圖片資料集。包含CIFAR-10和CIFAR-100兩個資料集。 Cifar-10由60000張32*32的RGB彩色圖片構成,共10個分類。50000張訓練,10000張測試(交叉驗證)。這個資料集最大的特點在於將識別遷移到了普適物體,而且應用於多分類。
CIFAR-100由60000張影象構成,包含100個類別,每個類別600張影象,其中500張用於訓練,100張用於測試。其中這100個類別又組成了20個大的類別,每個影象包含小類別和大類別兩個標籤。
官網提供了Matlab,C,Python三個版本的資料格式。影象如下圖所示,下載連結為http://www.cs.toronto.edu/~kriz/cifar.html

人臉識別:

資料庫 描述 用途 獲取方法
WebFace 10k+人,約500K張圖片 非限制場景 連結
FaceScrub 530人,約100k張圖片 非限制場景 連結
YouTube Face 1,595個人 3,425段視訊 非限制場景、視訊 連結
LFW 5k+人臉,超過10K張圖片 標準的人臉識別資料集 連結
MultiPIE 337個人的不同姿態、表情、光照的人臉影象,共750k+人臉影象 限制場景人臉識別 連結 需購買
MegaFace 690k不同的人的1000k人臉影象 新的人臉識別評測集合 連結
IJB-A 人臉識別,人臉檢測 連結
CAS-PEAL 1040個人的30k+張人臉影象,主要包含姿態、表情、光照變化 限制場景下人臉識別 連結
Pubfig 200個人的58k+人臉影象 非限制場景下的人臉識別 連結

人臉檢測:

資料庫 描述 用途 獲取方法
FDDB 2845張圖片中的5171張臉 標準人臉檢測評測集 連結
IJB-A 人臉識別,人臉檢測 連結
Caltech10k Web Faces 10k+人臉,提供雙眼和嘴巴的座標位置 人臉點檢測 連結

//------------------------------------------------------------//

下載人臉資料集的一個網站i.bug:https://ibug.doc.ic.ac.uk/resources/facial-point-annotations