人臉檢測之MTCNN網路

阿新 • • 發佈：2019-01-11

最近開始進行人臉檢測，所以根據自己的理解和別人的部落格總結一下自己對人臉檢測的認識，如果錯誤希望能夠指出。

人臉檢測的模型其實也有很多，簡單點可以基於MNIST的網路模型進行對自己的檢測，採用同樣的網路模型，不同的資料進行訓練會產生不同的作用，但這種情況往往無法進行泛化。也可以基於detect_object中的ssd_mobilenet網路為基礎在裡面加入一些人臉的資料和標籤進行檢測。開始的時候我找到了一個基於ssd_mobilenet的網路進行的，並將pb檔案集成了移動端但是發現對於複雜的場景及效率都不是很高。後來得出的結論是這些小眾的網路只適合用來根據自己的興趣進行測試（因為沒有理論支撐）。不能用來進行標準的人臉檢測。

MTCNN網路是目前使用比較廣泛的網路，它包含了人臉檢測和人臉對齊。其中人臉檢測可以用來進行後續的人臉識別。人臉對齊幫我們找出了人臉的眼睛，嘴，鼻子的位置可以用來進行對應的3D處理。我們可以在文獻地址中對文獻進行下載。

MTCNN網路是一個三層網路結構，第一層pnet的結果經過bounding box regression和NMS處理之後變為24x24的大小放入第二層進行處理，第二層rnet處理後的結果同樣經過bounding box regression 和NMS處理之後變成48x48的大小放入第三層onet網路進行處理，結果同樣經過bounding box regression 和 NMS處理變成人臉框和麵部標籤輸出。具體網路結構如下：

卷積計算使用的是步長為1，pading = "VALID"的方式，即：計算時劃過每個點並且每個點都要取到，對於超過邊界的點使用0表示。這樣可以保證在計算過程中圖片中的每個點都會被使用到。此時處理後的結果為R1-R2+1（R1為卷積計算前的大小，R2為卷積核的大小）。

池化採用的是步長為2，pading = "VALID"的方式，此時池化後的大小為1+x（x為R/2下取整數）。

對於MTCNN網路來說其輸入的資料來源是對應的圖片金字塔。圖片金字塔的意思就是我們根據不同的規模把圖片分成不同的大小，這些圖片就像金字塔一樣將圖片裁剪後堆起來。此時一張圖片就相當於變成了多張，如下。然後對每一張圖片分別放入到

p網路中進行處理。並對處理後的結果進行NMS處理。由於一張圖片被分成了很多張小的金字塔型別的圖片。所以對處理後的圖片整體進行一次NMS處理並最終生成對應的處理後的結果，然後對處理後的結果再進行R網路的處理，然後將結果進行NMS處理後再進行O網路的處理。生成最終的結果。

在卷積層計算之後採用的PRELU的啟用函式，其啟用函式的形式為：g(z) = max(0,z)+a * min(0,z)

在進行訓練時採用了線上選取資料的方式，即對損失函式選取前70%的資料進行訓練，因為後30%的資料對訓練的影響會很小。

在資料選取方面採用IOU（選取的圖片佔真實人臉的比例）來進行。共分為4各部分：negative:IOU<0.3,Landmark face: IOU在0.3和0.4之間，part face：IOU在0.4到0.65之間，positve：IOU大於0.65。根據上述原則對資料進行劃分並按照3:1:1:2的原則分配資料量。劃分的主要目的是為了用來標記資料。

人臉檢測之MTCNN網路

人臉檢測之MTCNN網路

人臉檢測之MTCNN程式碼實現

第九節、人臉檢測之Haar分類器

人臉檢測之face_recognition演算法除錯

HAAR與DLib的實時人臉檢測之實現與對比

淺析人臉檢測之Haar分類器方法

隨想錄（人臉檢測之dlib）

人臉檢測：MTCNN的訓練步驟和樣本的處理,文字描述

Pytorch實現人臉檢測演算法MTCNN

人臉檢測：MTCNN學習

淺析人臉檢測之Haar分類器方法【牛文強薦】

人臉檢測之PCN漸進式人臉檢測

人臉檢測之S3FD

MTCNN-將多工級聯卷積神經網路用於人臉檢測和對齊

MTCNN人臉檢測附完整C++代碼

MTCNN實時人臉檢測網絡詳解與opencv+tensorflow代碼演示

實時卷積神經網路實現人臉檢測和情感/性別分類

利用MTCNN和facenet實現人臉檢測和人臉識別

目標檢測之網路篇（2）【STN-空間變換網路】

目標檢測之模型篇（1）【CTPN連線文字提議網路】

人臉檢測之MTCNN網路

相關推薦