1. 程式人生 > >級聯人臉檢測--Detecting Faces Using Inside Cascaded Contextual CNN

級聯人臉檢測--Detecting Faces Using Inside Cascaded Contextual CNN

Detecting Faces Using Inside Cascaded Contextual CNN
ICCV2017

這裡也是使用級聯思想來進行人臉檢測,但是不是使用多個 CNN 網路來級聯的,而是使用一個CNN中不同網路層來做級聯的。簡單的來說就是CNN網路的前幾層完成簡單的人臉檢測,後面的網路完成難度較大的人臉檢測。 同時使用 body part localization 來輔助人臉檢測

real time performance

這裡寫圖片描述
這裡寫圖片描述

3 Overall Framework
這裡寫圖片描述

本文的網路結構主要包括三個部分:人臉候選區域提取模組 Proposal Net (P-Net), two Refinement Nets (R-Net-1 and R-Net-2)

人臉候選區域提取模組 Proposal Net (P-Net) 是由全卷積網路構成的,採用滑動視窗的方式對 影象金字塔(多尺度輸入影象)快速處理,得到人臉候選區域;
R-Net-1 and R-Net-2 主要對第一步得到的候選區域進行去虛警和 矩形框座標迴歸 bounding box regression

4 Inside Cascaded Structure
ICS has two extra components, Early Rejection Classifier (ER-C) and Data Routing (DR) layer
CNN網路的前幾層完成簡單的人臉檢測,後面的網路完成難度較大的人臉檢測, 這個策略可以讓我們後面的網路專注於學習難度較大的人臉檢測, deeper layers can focus on handling more difficult samples compared to traditional CNN。因為簡單的非人臉區域在網路的前幾層就被快速排除,這樣整體的檢測計算量就會降低。

4.1. Early Rejection Classifier
ERC 是一個小型分類器,用於人臉區域的二分類判斷。這個分類器得到的概率輸入 next DR layer 依此來決定是否需要進行後續處理。

4.2. Data Routing Layer
DR layer will change the sample set for the following network components
簡單的說就是後續區域不斷的減少,容易的負樣本被剔除了。

An example of neural network in ERC and CNN architectures of P-Net, R-Net-1 and R-Net-2
這裡寫圖片描述

6 Experiments

FDDB
這裡寫圖片描述

這裡寫圖片描述

WIDER FACE
這裡寫圖片描述

這裡寫圖片描述

Speed
這裡寫圖片描述