人臉識別中的活體檢測演算法

阿新 • • 發佈：2018-12-18

人臉識別中的活體檢測演算法綜述

1. 什麼是活體檢測？
判斷捕捉到的人臉是真實人臉，還是偽造的人臉攻擊（如：彩色紙張列印人臉圖，電子裝置螢幕中的人臉數字影象以及面具等）

2. 為什麼需要活體檢測？
在金融支付，門禁等應用場景，活體檢測一般是巢狀在人臉檢測與人臉識別or驗證中的模組，用來驗證是否使用者真實本人

3. 活體檢測對應的計算機視覺問題：
就是分類問題，可看成二分類（真 or 假）；也可看成多分類（真人，紙張攻擊，螢幕攻擊，面具攻擊）

Anti-spoofing 1.0 時代

從早期 handcrafted 特徵的傳統方法說起，目標很明確，就是找到活體與非活體攻擊的difference，然後根據這些差異來設計特徵，最後送給分類器去決策。

那麼問題來了，活體與非活體有哪些差異？

所以這段時期的文章都是很有針對性地設計特徵，列舉幾篇比較重要的：

Image Distortion Analysis[1], 2015

如下圖，單幀輸入的方法，設計了鏡面反射+影象質量失真+顏色等統計量特徵，合併後直接送SVM進行二分類。

Cons: 對於高清彩色列印的紙張 or 高清錄製視訊，質量失真不嚴重時，難區分開

Colour Texture[2], 2016

Oulu CMVS組的產物，算是傳統方法中的戰鬥機，特別簡潔實用，Matlab程式碼（課題組官網有），很適合搞成C++部署到門禁系統。

原理：活體與非活體，在RGB空間裡比較難區分，但在其他顏色空間裡的紋理有明顯差異

演算法：HSV空間人臉多級LBP特徵 + YCbCr空間人臉LPQ特徵（後在17年的paper拓展成用Color SURF特徵[12]，效能提升了一點）

Pros: 演算法簡潔高效易部署；也證明了活體與非活體在 HSV等其他空間也是 discriminative，故後續深度學習方法有將HSV等channel也作為輸入來提升效能。

Motion mag.-HOOF + LBP-TOP[3], 2014

DMD + LBP[4], 2015

前面說的都是單幀方法，這兩篇文章輸入的是連續多幀人臉圖；

主要通過捕獲活體與非活體微動作之間的差異來設計特徵。

一個是先通過運動放大來增強臉部微動作，然後提取方向光流直方圖HOOF + 動態紋理LBP-TOP 特徵；一個是通過動態模式分解DMD，得到最大運動能量的子空間圖，再分析紋理。

PS：這個 motion magnification 的預處理很差勁，加入了很多其他頻段噪聲（18年新出了一篇用 Deep learning 來搞 Motion mag[13]. 看起來效果挺好，可以嘗試用那個來做運動增強，再來光流or DMD）

DMD + LBP[4]

Cons: 基於Motion的方法，對於仿人臉wrapped紙張抖動和視訊攻擊，效果不好；因為它假定了活體與非活體之間的非剛性運動有明顯的區別，但其實這種微動作挺難描述與學習~

Pulse + texture[5], 2016

第一個將 remote pluse 應用到活體檢測中，多幀輸入

（交代下背景：在CVPR2014，Xiaobai Li[14] 已經提出了從人臉視訊裡測量心率的方法）

演算法流程：

1. 通過 pluse 在頻域上分佈不同先區分活體 or 照片攻擊（因為照片中的人臉提取的心率分佈不同）

2. 若判別1結果是活體，再 cascade 一個紋理LBP 分類器，來區分活體 or 螢幕攻擊（因為螢幕視訊中人臉心率分佈與活體相近）

Pros: 從學術界來說，引入了心理訊號這個新模態，很是進步；從工業界來看，如果不能一步到位，針對每種型別攻擊，也可進行 Cascade 對應的特徵及分類器的部署方式

Cons: 由於 remote heart rate 的演算法本來魯棒性也一般，故出來的 pulse-feature 的判別效能力很不能保證；再者螢幕video裡的人臉視訊出來的 pulse-feature 是否也有微小區別，還待驗證~

Anti-spoofing 2.0 時代

其實用 Deep learning 來做活體檢測，從15年陸陸續續就有人在研究，但由於公開資料集樣本太少，一直效能也超越不了傳統方法：

CNN-LSTM[6], 2015

多幀方法，想通過 CNN-LSTM 來模擬傳統方法 LBP-TOP，效能堪憂~

PatchNet pretrain[7]，CNN finetune, 2017

單幀方法，通過人臉分塊，pre-train 網路；然後再在 global 整個人臉圖 fine-tune，作用不大

Patch and Depth-Based CNNs[8], 2017

第一個考慮把人臉深度圖作為活體與非活體的差異特徵，因為像螢幕中的人臉一般是平的，而紙張中的人臉就算扭曲，和真人人臉的立體分佈也有差異；

就算用了很多 tricks 去 fusion，效能還是超越不了傳統方法。。。

Deep Pulse and Depth[9], 2018

發表在 CVPR2018 的文章，終於超越了傳統方法效能。

文章[8]的同一組人，設計了深度框架準端到端地去預測 Pulse統計量及 Depth map （這裡說的“準”，就是最後沒接分類器，直接通過樣本 feature 的相似距離，閾值決策）

在文章中明確指明：

過去方法把活體檢測看成二分類問題，直接讓DNN去學習，這樣學出來的cues不夠general 和 discriminative
將二分類問題換成帶目標性地特徵監督問題，即迴歸出 pulse 統計量 + 迴歸出 Depth map，保證網路學習的就是這兩種特徵（哈哈，不排除假設學到了 color texture 在裡面，黑箱網路這麼聰明

迴歸 Depth map，跟文章[8]中一致，就是通過 Landmark 然後 3DMMfitting 得到人臉3D shape，然後再閾值化去背景，得到 depth map 的 groundtruth，最後和網路預測的 estimated depth map 有 L2 loss。

而文章亮點在於設計了 Non-rigid Registration Layer 來對齊各幀人臉的非剛性運動（如姿態，表情等），然後通過RNN更好地學到 temporal pulse 資訊。

為什麼需要這個對齊網路呢？我們來想想，在做運動識別任務時，只需簡單把 sampling或者連續幀合併起來喂進網路就行了，是假定相機是不動的，物件在運動；而文中需要對連續人臉幀進行pulse特徵提取，主要物件是人臉上對應ROI在 temporal 上的 Intensity 變化，所以就需要把人臉當成是相機固定不動。

Micro-texture + SSD or binocular depth[10] , 2018

ArXiv 剛掛出不久的文章，最大的貢獻是把活體檢測直接放到人臉檢測（SSD，MTCNN等）模組裡作為一個類，即人臉檢測出來的 bbox 裡有背景，真人人臉，假人臉三類的置信度，這樣可以在早期就過濾掉一部分非活體。

所以整個系統速度非常地快，很適合工業界部署~

至於後續手工設計的 SPMT feature 和 TFBD feature 比較複雜繁瑣，分別是表徵 micro-texture 和 stereo structure of face，有興趣的同學可以去細看。

De-Spoofing[11], ECCV2018

單幀方法，與Paper[8]和[9]一樣，是MSU一個課題組做的。

文章的idea很有趣，啟發於影象去噪denoise 和影象去抖動 deblur。無論是噪聲圖還是模糊圖，都可看成是在原圖上加噪聲運算或者模糊運算（即下面的公式），而去噪和去抖動，就是估計噪聲分佈和模糊核，從而重構回原圖。

$x=\bar{x}+N(\tilde{x})$

文中把活體人臉圖看成是原圖 $\tilde{x}$ ，而非活體人臉圖看成是加了噪聲後失真的 x ，故 task 就變成估計 Spoof noise $N(\tilde{x})$ ，然後用這個 Noise pattern feature 去分類決策。

那問題來了，資料集沒有畫素級別一一對應的 groundtruth，也沒有Spoof Noise模型的先驗知識（如果有知道Noise模型，可以用Live Face來生成Spoofing Face），那拿什麼來當groundtruth，怎麼設計網路去估計 Spoofing noise 呢？

如一般Low-level image 任務一樣，文中利用Encoder-decoder來得到 Spoof noise N，然後通過殘差重構出 $\tilde{I}=I-N(\tilde{I})$ ，這就是下圖的DS Net。為了保證網路對於不同輸入，學出來的Noise是有效的，根據先驗知識設計了三個Loss來constrain：

Magnitude loss(當輸入是Live face時，N儘量逼近0)；

Repetitive loss(Spooing face的Noise圖在高頻段有較大的峰值)；

0\1Map Loss(讓Real Face 的 deep feature map分佈儘量逼近全0，而Spoofing face的 deep feature map 儘量逼近全1)

那網路右邊的 VQ-Net 和 DQ-Net 又有什麼作用呢？因為沒有 Live face 的 Groundtruth，要保證重構出來的分佈接近 Live face，作者用了對抗生成網路GAN (即 VQ-Net )去約束重構生成的 $\tilde{I}$ 與Live face分佈儘量一致；而用了文章[8]中的 pre-trained Depth model 來保證 $\tilde{I}$ 的深度圖與Live face的深度圖儘量一致。

Pros: 通過視覺化最終讓大眾知道了 Spoofing Noise 是長什麼樣子的~

Cons: 在實際場景中難部署（該模型假定Spoofing Noise是 strongly 存在的，當實際場景中活體的人臉圖質量並不是很高，而非活體攻擊的質量相對高時，Spoofing noise走不通）

後記：不同模態的相機輸入對於活體檢測的作用

近紅外NIR

由於NIR的光譜波段與可見光VIS不同，故真實人臉及非活體載體對於近紅外波段的吸收和反射強度也不同，即也可通過近紅外相機出來的影象來活體檢測。從出來的影象來說，近紅外影象對螢幕攻擊的區分度較大，對高清彩色紙張列印的區分度較小。

從特徵工程角度來說，方法無非也是提取NIR圖中的光照紋理特徵[15]或者遠端人臉心率特徵[16]來進行。下圖可見，上面兩行是真實人臉圖中人臉區域與背景區域的直方圖分佈，明顯與下面兩行的非活體圖的分佈不一致；而通過與文章[5]中一樣的rPPG提取方法，在文章[]中說明其在NIR影象中出來的特徵更加魯棒~

NIR人臉區域與背景區域直方圖[15]

結構光/ToF

由於結構光及ToF能在近距離裡相對準確地進行3D人臉重構，即可得到人臉及背景的點雲圖及深度圖，可作為精準活體檢測（而不像單目RGB或雙目RGB中仍需估計深度）。不過就是成本較高，看具體應用場景決定。

光場 Light field

光場相機具有光學顯微鏡頭陣列，且由於光場能描述空間中任意一點向任意方向的光線強度，出來的raw光場照片及不同重聚焦的照片，都能用於活體檢測：

3.1 raw光場照片及對應的子孔徑照片[17]

如下圖所示，對於真實人臉的臉頰邊緣的微鏡影象，其畫素應該是帶邊緣梯度分佈；而對應紙張列印或螢幕攻擊，其邊緣畫素是隨機均勻分佈：

3.2 使用一次拍照的重聚焦影象[18]

原理是可以從兩張重聚焦影象的差異中，估計出深度資訊；從特徵提取來說，真實人臉與非活體人臉的3D人臉模型不同，可提取差異影象中的亮度分佈特徵+聚焦區域銳利程度特徵+頻譜直方圖特徵。

至此，Face anti-spoofing 的簡單Survey已完畢~

毫無疑問，對於學術界，後續方向應該是用DL學習更精細的人臉3D特徵和人臉微變化微動作(Motion Spoofing Noise?) 表徵；而也可探索活體檢測與人臉檢測及人臉識別之間更緊密的關係。

對於工業界，可直接在人臉檢測時候預判是否活體；更可藉助近紅外，結構光/ToF等硬體做到更精準。

Reference:

[1] Di Wen, Hu Han, Anil K. Jain. Face Spoof Detection with Image Distortion Analysis. IEEE Transactions on Information Forensics and Security, 2015

[2] Zinelabidine Boulkenafet, Jukka Komulainen, Abdenour Hadid. Face Spoofing Detection Using Colour Texture Analysis. IEEE TRANSACTIONS ON INFORMATION FORENSICS AND SECURITY, 2016

[3] Samarth Bharadwaj. Face Anti-spoofing via Motion Magnification and

Multifeature Videolet Aggregation, 2014

[4] Santosh Tirunagari, Norman Poh. Detection of Face Spoofing Using Visual Dynamics. IEEE TRANS. ON INFORMATION FORENSICS AND SECURIT, 2015

[5] Xiaobai Li, , Guoying Zhao. Generalized face anti-spoofing by detecting pulse

from face videos, 2016 23rd ICPR

[6] Zhenqi Xu. Learning Temporal Features Using LSTM-CNN Architecture for Face Anti-spoofing, 2015 3rd IAPR

[7] Gustavo Botelho de Souza, On the Learning of Deep Local Features for

Robust Face Spoofing Detection, 2017

[8] Yousef Atoum, Xiaoming Liu. Face Anti-Spoofing Using Patch and Depth-Based CNNs, 2017

[9] Yaojie Liu, Amin Jourabloo, Xiaoming Liu, Learning Deep Models for Face Anti-Spoofing: Binary or Auxiliary Supervision ，CVPR2018

[10] Discriminative Representation Combinations for Accurate Face Spoofing Detection，2018 PR

[11] Amin Jourabloo, Face De-Spoofing: Anti-Spoofing via Noise Modeling, ECCV2018

[12]Zinelabidine Boulkenafet, Face Antispoofing Using Speeded-Up Robust Features and Fisher Vector Encoding, IEEE SIGNAL PROCESSING LETTERS, VOL. 24, NO. 2, FEBRUARY 2017

[13]Tae-Hyun Oh, Learning-based Video Motion Magnification, ECCV2018

[14]Xiaobai Li, Remote Heart Rate Measurement From Face Videos Under Realistic Situations

[15]Xudong Sun, Context Based Face Spoofing Detection Using Active Near-Infrared Images, ICPR 2016

[16]Javier Hernandez-Ortega, Time Analysis of Pulse-based Face Anti-Spoofing in Visible and NIR, CVPR2018 workshop

[17]Sooyeon Kim, Face Liveness Detection Using a Light Field Camera, 2014

[18]Xiaohua Xie, One-snapshot Face Anti-spoofing Using a Light Field Camera, 2017

JAVA實現人臉識別，活體檢測之百度API

-----------------------8/16更新--------------------------- 有人問原始碼: 連結：https://pan.baidu.com/s/1WP37IBacu6VZwtNOUDbSYg 密碼：vdzm 在這 -------

人臉識別中的活體檢測演算法綜述

1. 什麼是活體檢測？判斷捕捉到的人臉是真實人臉，還是偽造的人臉攻擊（如：彩色紙張列印人臉圖，電子裝置螢幕中的人臉數字影象以及面具等）2. 為什麼需要活體檢測？在金融支付，門禁等應用場景，活體檢測一般是巢狀在人臉檢測與人臉識別or驗證中的模組，用來驗證是否使用者真實

人臉識別中的活體檢測演算法

人臉識別中的活體檢測演算法綜述 1. 什麼是活體檢測？判斷捕捉到的人臉是真實人臉，還是偽造的人臉攻擊（如：彩色紙張列印人臉圖，電子裝置螢幕中的人臉數字影象以及面具等） 2. 為什麼需要活體檢測？在金融支付，門禁等應用場景，活體檢測一般

證件識別，身份證識別，人臉校對，活體檢測，OCR身份證識別

拍照 cdn 努力 ocr識別 img 預覽優缺點高效時間在實名制鋪天蓋地的情況下，為了提高效率、節省成本，同時提升用戶體驗，身份證識別已迅速被各個企業所應用。目前，市面上有身份證識別產品的公司大約有七八家，各家特點不一樣，在選擇身份證識別產品時要綜合考量幾家的優

人臉識別中的harr特征提取（轉）

tegra 思想 facede 時間掃描計算開始矩形輸入影響AdaBoost人臉檢測訓練算法速度很重要的兩方面是特征選取和特征計算。選取的特征為矩特征為Haar特征，計算的方法為積分圖。（1）Haar特征： Haar特征分為三類：邊緣特征、線性特征、中

知物由學 | 基於DNN的人臉識別中的反欺騙機制

ctu 打印 mage eas 系統分類傳遞實時技術分享 “知物由學”是網易雲易盾打造的一個品牌欄目，詞語出自漢·王充《論衡·實知》。人，能力有高下之分，學習才知道事物的道理，而後才有智慧，不去求問就不會知道。“知物由學”希望通過一篇篇技術幹貨、趨勢解讀、人物思考和

TOP高校創新科技大賽【人像精細分割||人臉識別||人體關鍵點檢測】

競賽資訊任務與資料競賽圈提交結果排行榜參賽人員參賽團隊我的隊伍任務 1

深度學習在人臉識別中的應用 —— 優圖祖母模型的「進化」

原作者: 騰訊優圖 | 來自: 機器之心序言——「弱弱」的人工智慧說到人工智慧（Artificial Intelligence, AI）人們總是很容易和全知、全能這樣的詞聯絡起來。大量關於人工智慧的科幻電影更給人工智慧蒙上一層神祕的色彩。強如《黑客帝國》、《機械公敵》中的AI要翻

深度學習中目標檢測演算法 RCNN、Fast RCNN、Faster RCNN 的基本思想

前言影象分類，檢測及分割是計算機視覺領域的三大任務。即影象理解的三個層次：分類（Classification），即是將影象結構化為某一類別的資訊，用事先確定好的類別(string)或例項ID來描述圖片。這一任務是最簡單、最基礎的影象理解任務，也是深度學習模型最先取得突

【AI測試】人臉識別中性別識別模型評價（專案例項）

以人臉識別中的性別識別測試為例項，對整個測試過程進行詳細講解。舉例有一個專案，要求是輸入一張人臉照片，使用演算法對照片中人物的性別進行預測男或女。測試人員需要對演算法模型的表現進行評價，輸出客觀的評價指標。測試工作開展：一、需求分析，檢視需求文件，瞭

sklearn中異常檢測演算法建模彙總

借鑑於http://scikit-learn.org/stable/modules/outlier_detection.html#novelty-and-outlier-detection 一、概況兩大異常 novelty detection 這些訓練資料沒有被異常值所汙染，我們有

faster r-cnn中評價檢測演算法中的指標

小魚在用faster r-cnn進行目標檢測時，必不可少要對結果進行評價，業界統一的評價檢測指標是看RP曲線和AUC的值。看了很多網上別人寫的歸納，這裡做一個統一，也是怕自己忘記，又要去翻天覆地的搜尋。為方便理解，不被繞暈，先舉一批資料例子和一張說明圖：

深度學習在人臉識別中的應用 ——優圖祖母模型的“進化”

序言——“弱弱”的人工智慧說到人工智慧（Artificial Intelligence, AI）人們總是很容易和全知、全能這樣的詞聯絡起來。大量關於AI的科幻電影更給人工智慧蒙上一層神祕的色彩。強如《黑客帝國》、《機械公敵》中的AI要翻身做主人統治全人類。稍弱點的《機械姬

從資料角度看人臉識別中Feature Normalization,Weight Normalization以及Triplet的作用從資料角度看人臉識別中Feature Normalization,Weight Normalization以及Triplet的作用

轉從資料角度看人臉識別中Feature Normalization,Weight Normalization以及Triplet的作用 2018年10月19日 16:42:52

人臉識別中的活體檢測演算法

人臉識別中的活體檢測演算法綜述

Anti-spoofing 1.0 時代

後記：不同模態的相機輸入對於活體檢測的作用

JAVA實現人臉識別，活體檢測之百度API

人臉識別中的活體檢測演算法綜述

人臉識別中的活體檢測演算法

證件識別，身份證識別，人臉校對，活體檢測，OCR身份證識別

人臉識別中的harr特征提取（轉）

知物由學 | 基於DNN的人臉識別中的反欺騙機制

TOP高校創新科技大賽【人像精細分割||人臉識別||人體關鍵點檢測】

深度學習在人臉識別中的應用 —— 優圖祖母模型的「進化」

深度學習中目標檢測演算法 RCNN、Fast RCNN、Faster RCNN 的基本思想

【AI測試】人臉識別中性別識別模型評價（專案例項）

sklearn中異常檢測演算法建模彙總

faster r-cnn中評價檢測演算法中的指標

深度學習在人臉識別中的應用 ——優圖祖母模型的“進化”

從資料角度看人臉識別中Feature Normalization,Weight Normalization以及Triplet的作用從資料角度看人臉識別中Feature Normalization,Weight Normalization以及Triplet的作用

LBP特徵旋轉不變標準型圓型及其在人臉識別中的應用含程式碼

資料探勘—LDA,PCA特徵提取降維與SVM多分類在人臉識別中的應用－資料集ORL

人臉資料庫大全（包括人臉識別、關鍵點檢測、表情識別，人臉姿態等等）

人臉識別之疲勞檢測（二）閾值法、KNN分類和Ｋ-means聚類

Android 人臉識別活體檢測人臉對比

[Xcode10 實際操作]九、實用進階-(18)影象人臉識別：對圖片中的人像進行面部檢測

人臉識別中的活體檢測演算法

人臉識別中的活體檢測演算法綜述

Anti-spoofing 1.0 時代

後記：不同模態的相機輸入對於活體檢測的作用

相關推薦