1. 程式人生 > >常用人臉檢測資料庫

常用人臉檢測資料庫

一、概述

人臉檢測的目標是找出影象中所有的人臉對應的位置,演算法的輸出是人臉外接矩形在影象中的座標,可能還包括姿態如傾斜角度等資訊。常用的人臉檢測資料庫包括:FDDB和WIDER FACE。

二、FDDB

FDDB總共2845張影象,5171張,人臉非約束環境,人臉的難度較大,有面部表情,雙下巴,光照變化,穿戴,誇張髮型,遮擋等難點,是目標最常用的資料庫。有以下特點:

影象解析度較小,所有影象的較長邊縮放到450,也就是說所有影象都小於450*450,最小標註人臉20*20,包括彩色和灰度兩類影象;
每張影象的人臉數量偏少,平均1.8人臉/圖,絕大多數影象都只有一人臉;
資料集完全公開,published methods通常都有論文,大部分都開原始碼且可以復現,可靠性高;unpublished methods沒有論文沒有程式碼,無法確認它們的訓練集是否完全隔離,持懷疑態度最好,通常不做比較。(扔幾張FDDB的影象到訓練集,VJ也可以訓練出很高的召回率。。需要考慮人品能不能抵擋住利益的誘惑)
有其他隔離資料集無限制訓練再FDDB測試,和FDDB十折交叉驗證兩種,鑑於FDDB影象數量較少,近幾年論文提交結果也都是無限制訓練再FDDB測試方式,所以,如果要和published methods提交結果比較,請照做。山世光老師也說十折交叉驗證通常會高1~3%。
結果有離散分數discROC和連續分數contROC兩種,discROC僅關心IoU是不是大於0.5,contROC是IoU越大越好。鑑於大家都採用無限制訓練加FDDB測試的方式,detector會繼承訓練資料集的標註風格,繼而影響contROC,所以discROC比較重要,contROC看看就行了,不用太在意。

三、WIDER FACE:

WIDER FACE總共32203影象,393703標註人臉,目前難度最大,各種難點比較全面:尺度,姿態,遮擋,表情,化妝,光照等。有以下特點有:

影象解析度普遍偏高,所有影象的寬都縮放到1024,最小標註人臉10*10,都是彩色影象;
每張影象的人臉資料偏多,平均12.2人臉/圖,密集小人臉非常多;
分訓練集train/驗證集val/測試集test,分別佔40%/10%/50%,而且測試集的標註結果(ground truth)沒有公開,需要提交結果給官方比較,更加公平公正,而且測試集非常大,結果可靠性極高;
根據EdgeBox的檢測率情況劃分為三個難度等級:Easy, Medium, Hard。