1. 程式人生 > >使用漸進校準網路(PCN)的實時旋轉不變人臉檢測

使用漸進校準網路(PCN)的實時旋轉不變人臉檢測

論文為山世光老師組2018 cvpr的作品。

人臉3D變換基礎:

平面內旋轉(左右歪頭問題)roll,本人重點討論的問題

平面外左右旋轉(正臉,側臉問題)yaw

平面外俯仰(仰頭,低頭問題)pitch 

方向相關人臉檢測的思路:

(a) 使用資料增強的方法,增加各種角度的人臉進行訓練,該思路大大的依賴於樣本的多樣性,同時為了讓網路能同時學到這麼多的資訊,也需要一個較大的網路結構。

(b) 使用分治的策略,訓練不同角度的人臉分類器,然後做整合,缺點就是人臉的角度存在360,要訓練這麼多分類器,時間複雜度和模型複雜度都太大。

(c) 邊檢測人臉,邊計算出人臉的角度,再根據角度對人臉進行旋轉,然後只訓練一個正臉的分類器既可,缺點就是,角度要麼是個

360度的分類或者回歸問題,容錯空間太大,正如下圖所示,直接預測會存在誤差較大的可能。

本文基於第(c)點進行改進。使用由粗到精的思路(coarse to fine)

文章使用了3個漸進校準網路(PCN)來由粗到細的預測人臉角度值。

PCN-1進行人臉0度和-180度的2分類任務,將人臉從-180度——180度矯正為-90度——90度。

PCN-2進行人臉0度,90度,-90度的3分類任務,將人臉從-90度——90度矯正為-45度——45度。

PCN-3直接進行人臉角度迴歸,得出旋轉角度。

最終人臉的角度就是PCN-1角度+ PCN-2角度+ PCN-3角度


其中3PCN校準網路的詳細結構如下圖,主要還是借鑑的MTCNN的結構,不同點就是

(1) MTCNN中的5個關鍵點的迴歸換為人臉方向角度的分類和迴歸

(2) MTCNN中第一個網路P-Net的輸入為12*12*3,這裡的第一個網路PCN-1輸入為24*24*3

整體總結:

文章使用由粗到細的思想進行人臉角度的預測,並且利用該角度值進行人臉角度的矯正,這樣相比於直接訓練各個角度人臉的網路,使用先進行人臉矯正再進行只有正臉的人臉網路訓練就可以大大的提高召回率。

但是從工程上來看,總感覺同時出人臉角度值和人臉框不如同時出人臉關鍵點和人臉框更實用,因為有了關鍵點就可以算出角度了。

從創新性來看,也感覺略有不足。因為,假設如果第一個網路可以分出正臉和倒臉,那麼經過旋轉矯正後,人臉分類的置信度分數會更高,但是本質沒有改變,因為第一個網路已經可以分類倒臉了。假如第一個網路不能分出正臉和倒臉,那麼預測的角度值也沒用。

References



相關推薦

使用漸進校準網路(PCN)的實時旋轉人臉檢測

論文為山世光老師組2018 cvpr的作品。人臉3D變換基礎:平面內旋轉(左右歪頭問題):roll,本人重點討論的問題平面外左右旋轉(正臉,側臉問題):yaw平面外俯仰(仰頭,低頭問題):pitch 方向相關人臉檢測的思路:(a) 使用資料增強的方法,增加各種角度的人臉進行訓

【CVPR2018】實時旋轉魯棒人臉檢測演算法

編者按:蘇軾在《題西林壁》中曾寫道:“橫看成嶺側成峰,遠近高低各不同。”這兩句詩闡釋了視角的變化

LBP特徵 旋轉 標準型 圓型 及其在人臉識別中的應用含程式碼

LBP(Local Binary Patterns,區域性二值模式)是一種能夠有效地度量和提取影象區域性紋理資訊的運算元,具有旋轉不變性和灰度不變性等顯著的優點。它是人臉識別中一種提取特徵的重要方法,具有對光照不敏感的特性,但是對姿態和表情的魯棒性不強。 1、

灰度變性LBP( gray scale invariant) 旋轉變性LBP(rotation invariant)旋轉等價LBP(rotation & uniform invarian )

老外的原文:《Multiresolution gray-scale and rotation invariant texture classification with local binary patterns》 Timo Ojala, Matti PietikaÈ

【學習筆記】SIFT尺度特征 (配合UCF-CRCV課程視頻)

rri cnblogs -o mask 畫出 blocks http ucf 產生 SIFT尺度不變特征 D. Lowe. Distinctive image features from scale-invariant key points, IJCV 2004 -Lect

iOS: 獲取的UDID

ref 才會 baidu 成了 個人 strip targe lock 添加 iOS: 獲取不變的UDID iOS唯一標識的歷史歷程 iOS 6.0 在iOS6.0以前,是使用uniqueIdentifier來獲取手機的唯一標識,後來蘋果感覺這樣會泄露用戶隱藏,就封掉了這

路由器重啟,是否ip就永遠

由器 class 可能 公網ip 不變 時間 自動 如果 重啟 今天發現公司的公網ip突然變了,沒有人去動過路由器怎麽會這樣呢?經查原因如下:1、不一定,IP變化是每一次撥號重新獲取的。2、路由器重啟了,會自動撥號,獲得IP3、但如果說因各種原因,掉線,路由器也會重新撥號鏈

SQLite Expert表分離和解決SQLite Expert刪除表後大小的問題

大小 nbsp where 效果 外鍵 mob 一點 冗余 java代碼 最後要使用到號碼歸屬地的查詢,在網上找到一個數據庫文件。大小有12M多,壓縮成zip也有1.9M,這樣對於一個apk的大小非常不利,後來看了一下數據庫的內容,發現有非常多冗余。特別是中文字

303. Range Sum Query - Immutable 數組範圍求和 -

family elements ger mon integer ack man gin 不變 Given an integer array nums, find the sum of the elements between indices i and j (i ≤ j),

劍指offer之 奇數偶數數組位置調整且保存順序

cor clas for [] 空間 ++ highlight n) == public class Solution { public void reOrderArray(int [] array) { reOrderCore(

array_filter 過濾一維中空數組,數組的序列

logs type arp true [1] ont cnblogs content 序列 <?php header(‘Content-type:text;charset=utf8‘); $str = "%11111%22222%333333%"; $arr =

JavaSE8基礎 Integer 包裝類對象的值

包裝類 clas () 查看 new like intval ger nts 禮悟:   好好學習多思考,尊師重道存感恩。葉見尋根三二一,江河湖海同一體。 虛懷若谷良心主,願行無悔給最苦。讀書鍛煉強身心,誠勸且行且珍惜。 javaSE

[離散時間信號處理學習筆記] 2. 線性時系統

加權 n-1 -m 及其 border 離散 begin 其中 vol 線性時不變系統的定義 線性時不變系統(LTI)是離散時間系統中特別重要的一種系統,該系統包含線性以及時不變性,用卷積來表征。 前面有講過序列$x[n]$可以表示成幅度加權的延遲單位樣本序列的和的形式 $

參數:默認參數必須指向對象!

tar log 參數 對象 get 不變 b16 https gpo 定義默認參數要牢記一點:默認參數必須指向不變對象!參見廖雪峰url:https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df4

3.3.5 高效讀取:模式下的CopyOnWriteArrayList

true ray 新的 nts ont image public bool write 源碼分析:讀寫(get,add) 一:get 方法 private E get(Object[] a, int index) { return (E) a[index];}可

表單輸入框中如何改變光標的顏色而文字顏色

效果 caret 如何改變 info 紅色 圖片 css 分享 mage 如圖所示,要想改變光標顏色,可以通過css的caret-color來設置 input { caret-color: red; } 顯示效果,鼠標點擊輸入框之後,光標顏色

利用cookie,實現刷新頁面跳轉,左側菜單點擊後狀態保持

coo spl 失效 不變 find sco a標簽 左側菜單 cookie 是一個後臺關系系統,後臺是phyton,後臺把左側菜單都是利用a標簽進行跳轉,導致菜單點擊狀態在頁面刷新後失效,用戶體驗不好,被要求改掉。 查了一些資料。利用cookie終於搞定了這個大問題。主要

MT【145】的平面角

angle 運動 delta 向上 del bubuko 平面 wid 相交 (2018,4月學考數學選擇最後一題)如圖,設矩形$ABCD$所在平面與梯形$ACEF$所在平面相交於$AC$. 若$AB=1,BC=\sqrt{3},AF=EF=EC=1,$則下面二面角的平面

理解es6中的const與“

凍結 布爾 內存 test arr foo 理解 pro IV const實際上保證的,並不是變量的值不得改動,而是變量指向的那個內存地址不得改動。 效果 對於簡單類型的數據(數值、字符串、布爾值),值就保存在變量指向的那個內存地址,因此等同於常量。 對於復合類型的數

MyEclipse復制項目發布路徑的問題解決

MyEclipse MyEclipse復制項目 右鍵復制,如圖: 右鍵空白,如圖: 右鍵復制的項目,如圖: 重新發布即可MyEclipse復制項目發布路徑不變的問題解決