1. 程式人生 > >人臉識別系列(九):FR+FCN

人臉識別系列(九):FR+FCN

FR:是指face recovery FCN是指face convolution network

正面人臉重構:

這是一篇14年的論文,比較有意思的是作者採用了一個簡單卷積神經網路來完成正面人臉重構,以對齊人臉,然後基於對齊的人臉進行人臉驗證。

要重構正面的人臉,進行人臉恢復,首先涉及到一個選擇正面人臉作為GroudTruth的問題,也就是我們的重構目標,因此需要從訓練集中挑選出我們覺得合適的正面人臉的選擇。

正面人臉的選擇:

  1. 左右對稱性,2. 影象的秩Rank,3,結合1和2(文章採用的方法)。

所以採用的度量公式如下:

img

其中Yi是人臉影象,P,Q 矩陣是引數,
這裡寫圖片描述

第一項表示對稱性,

第二項表示矩陣的核範數:矩陣的奇異值之和可以近似為影象的秩。

λ 則表示這兩個準則的tradeoff。

在文章中,作者只是採用M值最小的。(可能會有問題,或者說有改進的空間,文章中作者也說了,可以採用線性組合等來計算正面人臉)

正面人臉選擇之後,就可以進行訓練是深度學習網路了,其訓練的損失函式是:img

其中W是深度神經網路的引數,Yi是選擇的正面臉。

網路的結構如下所示:

img

其包含3個卷積層,其中頭兩個採用max pooling ,最後一個採用全連線,不共享權值,具體的網路結構跟經典的沒有太大的改進。

網路結構:

  1. 對於每一個訓練影象對,重構正面臉,然後提取5個特徵點Landmark,然後基於這些Landmark提取Patch。
  2. 利用每個patch對來訓練網路,多個特徵最後被級聯在一起形成最後的特徵。

img

3.網路尾部使用Logistic迴歸來作為作為損失函式,根據一次輸入兩張圖片來預測是否是同一類,考慮到這是一篇較早期的人臉識別文章,那時候人臉識別普遍沒有如今的水平,因此沒有采用效果更好Softmax也是可以理解的。

LFW得分:

在LFW上獲得%96.45準確率