人臉特徵提取模型(細緻分析對比分析)-基於LFW資料集
動機
總所周知,LFW資料在人臉特徵提取模型的驗證上是一個基本的標杆,目前大部分的方法在上面的效果已經都超過了99%的驗證準確度,但是單純的測試模型在上面的準確度,並不能分析出模型的效能到底好多少?到底好在什麼方面?(因為大部分模型的驗證精度都差別很小了)。
出於以上原因,為了對比不同模型具體效能的差異,設計瞭如下分析方案:
1)計算LFW 6000對人臉對的驗證相似度(其中3000組匹配人臉,3000組不匹配人臉);
2)分別統計3000組匹配人臉和3000組不匹配人臉的驗證相似度(-1-1之間)的分佈情況;
3)分析兩種分佈的特點,並得出結論。
模型
這裡主要對比四種人臉特徵提取的方案:
1)centerloss
2)CosineFace
3)MobileFaceNet
4)Combined Margin loss
這四種模型均是利用webface、VGGFace2資料集重新訓練復現得到。並且經過驗證,在LFW上交叉驗證的準確率依次為98.25%、98.81%、98.95%、99.43%。
具體效能對比
下面的四幅圖是四個模型在3000組匹配人臉和3000組不匹配人臉的驗證相似度(-1-1之間)的分佈情況,其中橙色的柱狀圖為3000對不匹配人臉的相似度統計分佈,藍色的柱狀為3000度匹配人臉的相似度統計分佈;
每種顏色的柱狀都有10列,分別代表相似度得分在【-1-0.1】【0.1-0.2】【0.2-0.3】【0.3-0.4】【0.4-0.5】【0.5-0.6】【0.6-0.7】【0.7-0.8】【0.8-0.9】【0.9-1】的分佈,每個柱子的縱座標為在該區間上統計得到的數量。
舉例說明(centerloss模型):
3000組不匹配人臉的驗證相似度(橙色)在10個區間的數量分別為【1914,548,338,148,42,8,1,1,0,0】
3000組匹配人臉的驗證相似度(藍色)在10個區間的數量分別為【2,5,8,35,106,343,760,1080,596,65】
具體四種模型在lfw測試的效能分佈圖下四個圖。具體分析見後面。
Centerloss
CosineFace
MobileFaceNet
Combined Margin loss
效能分析對比
1)從峰值分佈分析
從以上四幅圖看出,四個模型在不匹配人臉的峰值都在【-1-0.1】這個區間,但峰值的大小來看CosineFace>Combined margin>MobileFace>centerloss
在匹配人臉的峰值依次在【0.7-0.8】【0.5-0.6】【0.6-0.7】【0.7-0.8】,總體來說centerloss>combined margin>Mobileface>cosineface
2)從分佈的區間分析
四個模型在不匹配人臉的分佈依次在【-1-0.8】【-1-0.4】【-1-0.5】【-1-0.5】,總體combined margin=cosinefac>Mobileface>centerloss
在匹配人臉的分佈都在【-1-1】之間,但是仔細對比發現,Combined margin = centerloss>Mobileface>cosineface
3)從不匹配人臉相似度分佈與匹配人臉相似度分佈的交叉情況分析
從交叉範圍和交叉數量可以看出交叉最嚴重的是centerloss。
依次對比應該是combined margin>cosineface>mobileface>centerloss
從以上細節對比,可以得出結論:
Combined margin得到的模型效能最好,能夠讓不匹配的人相似度儘量低,匹配的人相似度儘量高;並且不匹配和匹配的區分效能也更好,容易確定其分介面。