1. 程式人生 > >[計算機視覺論文速遞] 2018-03-18

[計算機視覺論文速遞] 2018-03-18

通知:這篇推文有10篇論文速遞資訊,涉及人臉表情識別、人臉替換、3D人臉重建、Re-ID、目標檢測和目標跟蹤等方向

人臉

[1]《Deep Structure Inference Network for Facial Action Unit Recognition》

Abstract:面部表情是稱為行動單位(AU)的基本元件的組合。 識別AU是開發常規面部表情分析的關鍵。 近年來,自動AU識別中的大部分努力致力於學習區域性特徵的組合,並利用動作單元之間的相關性。 在本文中,我們提出了一種深度神經網路架構,通過在初始階段結合學習的區域性和全域性特徵來解決這兩個問題,並在類之間複製類似於後面階段的圖形模型推理方法的訊息傳遞演算法。 我們證明,通過增加監督來端對端地訓練模型,我們分別提高了BP4D和DISFA資料集的5.3%和8.2%的效能水平。

arXiv:https://arxiv.org/abs/1803.05873

[2]《Deep Adaptive Attention for Joint Facial Action Unit Detection and Face Alignment》

Abstract:面部動作單元(AU)檢測和麵部對齊是兩個高度相關的任務,因為面部標誌可以提供精確的AU位置,以便於為AU檢測提取有意義的區域性特徵。大多數現有的AU檢測工作經常將面對齊作為預處理並獨立處理這兩個任務。在本文中,我們提出了一種新穎的端到端深度學習框架,用於聯合AU檢測和人臉對齊,這在以前沒有探討過。特別是首先學習多尺度共享特徵,並將高層次的人臉對齊特徵引入AU檢測。此外,為了提取精確的區域性特徵,我們提出了一種自適應注意力學習模組,以自適應地優化每個AU的注意力圖。最後,組合的區域性特徵與面部對齊特徵和用於AU檢測的全域性特徵整合。對BP4D和DISFA基準的實驗表明,我們的框架明顯優於AU檢測的最先進方法。

arXiv:https://arxiv.org/abs/1803.05588

[3]《Image Registration Based Flicker Solving in Video Face Replacement and Analysis Based Sub-pixel Image Registration》

ICIS 2017

Abstract:本文提出了一種視訊人臉替換的框架,它處理視訊序列中交換人臉的閃爍。該框架包含兩個主要創新:1)利用影象配準技術來調整源視訊和目標視訊面以消除分段視訊臉部序列的閃爍或抖動; 2)提出了一種快速亞畫素影象配準方法,以獲得更高的精度和效率。與先驗作品不同,它將重疊區域最小化,並將時空連貫性考慮在內。導致視訊閃爍通常是由混合目標人臉頻繁變化的邊界以及視訊序列之間和之後的未註冊人臉造成的。提出了亞畫素影象配準方法來解決閃爍問題。在對齊過程中,通過最大化影象的相似性和下采樣策略來加速整個過程,並且通過分析方法進行的子畫素影象配準是單步影象匹配,從而制定整數畫素配準。實驗結果表明,該演算法在不同資料集上進行實驗時,減少了計算時間,獲得了很高的精度。

注:視訊人臉替換,很有意思!!!

arXiv:https://arxiv.org/abs/1803.05851

[4]《Accurate Facial Parts Localization and Deep Learning for 3D Facial Expression Recognition》

Abstract:有意義的臉部可以傳達面部動作單元檢測和表情預測的關鍵線索。紋理化的3D人臉掃描可以提供詳細的3D幾何形狀和麵部表情識別(FER)有益的人臉2D紋理外觀提示。然而,準確的臉部提取以及它們的融合是具有挑戰性的任務。本文提出了一種基於精確臉部提取和臉部深部特徵融合的全新三維FER系統。具體而言,每個紋理化的3D人臉掃描首先被表示為具有一對一密集對應關係的2D紋理圖和深度圖。然後,使用由面部標誌點定位,面部旋轉修正,面部尺寸調整,臉部部分包圍盒提取和後處理程式組成的新的4階段過程來提取紋理圖和深度圖的面部部分。最後,分別從紋理貼圖和深度貼圖中學習所有面部的深度融合卷積神經網路(CNNs)特徵,並將非線性支援向量機用於表達預測。在BU-3DFE資料庫上進行實驗,證明梳理不同面部部分,紋理和深度線索的有效性,並與相同設定下的所有現有方法進行比較,報告最先進的結果。

arXiv:https://arxiv.org/abs/1803.05846

[5]《Facelet-Bank for Fast Portrait Manipulation》

Accepted by CVPR 2018

Abstract:由於智慧手機和社交網路的普及,數字臉部操縱已成為觸控影象的流行和迷人方式。 隨著各種各樣的使用者喜好,面部表情和配件,一個通用和靈活的模型是必要的,以適應不同型別的面部編輯。 在本文中,我們提出了基於支援快速推理,編輯效果控制和快速部分模型更新的端到端卷積神經網路的模型。 另外,該模型從具有不同屬性的不成對影象集中學習。 實驗結果表明,我們的框架可以處理各種各樣的臉部表情,配件和化妝效果,以高速生成高解析度和高質量的效果。

arXiv:https://arxiv.org/abs/1803.05576

[6]《Evaluation of Dense 3D Reconstruction from 2D Face Images in the Wild》

Abstract:本文研究了單個2D影象的密集三維人臉重建評估。 為此,我們組織了一次比賽,提供了一個新的基準資料集,其中包含了2000個2D科目的2D面部影象以及他們的3D地面真相人臉掃描。 與之前的競賽或挑戰相比,這種新的基準資料集的目標是使用真實,準確和高解析度的3D ground-truth人臉掃描來評估3D稠密人臉重建演算法的準確性。 除了資料集之外,我們還提供標準協議以及用於評估的Python指令碼。 最後,我們報告了三個最先進的三維人臉重建系統在新基準資料集上的結果。 本次比賽是與2018年第13屆IEEE自動人臉識別和手勢會議一起舉辦的。

arXiv:https://arxiv.org/abs/1803.05536

github:https://github.com/patrikhuber/fg2018-competition 

Re-ID

[7]《Virtual CNN Branching: Efficient Feature Ensemble for Person Re-Identification》

Abstract:在本文中,我們介紹一種卷積神經網路(CNN)的集合方法,稱為“虛擬分支”,它可以在幾乎沒有附加引數的情況下實施,並且可以在標準CNN的基礎上進行計算。 我們在行人重識別的任務下提出我們的方法。 我們的CNN模型由共享底層組成,其次是“虛擬”分支,來自常規卷積層和完全連線層的神經元被劃分為多個集合。 每個虛擬分支用不同的資料進行訓練以專注於不同的方面,例如特定的身體區域或姿勢取向。 通過這種方式,可以在幾乎沒有任何額外成本的情況下獲得魯棒的整合表示,以抵抗人體錯位,變形或視角變化。 所提出的方法在多人再識別基準資料集上實現了競爭性表現,包括Market-1501,CUHK03和DukeMMC-reID。

arXiv:https://arxiv.org/abs/1803.05872

目標檢測

[8]《Pseudo Mask Augmented Object Detection》

Abstract:在這項工作中,我們提出了一個新穎而有效的框架,以利用僅由邊框註解監督的例項級分割資訊來促進物件檢測。從聯合物件檢測和例項分割網路開始,我們提出從例項級物件分割網路訓練中遞迴地估計pseudo ground-truth物件掩碼,然後利用自頂向下分割反饋增強檢測網路。pseudo ground-truth掩模和網路引數被優化以替代彼此互惠。為了在每次迭代中獲得有較好的偽掩碼,我們嵌入了包含低階影象外觀一致性和邊界框註釋的圖形推斷,以細化由分割網路預測的分割掩模。我們的方法通過結合從弱監督分割網路學習的詳細的逐畫素資訊來逐步提高物件檢測效能。對PASCAL VOC 2007和2012 [12]中的檢測任務的廣泛評估證實了所提出的方法是有效的。

arXiv:https://arxiv.org/abs/1803.05858

[9]《Object Detection in Video with Spatiotemporal Sampling Networks》

Abstract:我們提出了一種時空取樣網路(STSN),它使用跨時間變形卷積來進行視訊中的物體檢測。 我們的STSN通過學習從相鄰幀的空間取樣特徵來在視訊幀中執行物件檢測。 這自然使得該方法對於單個幀中的遮擋或運動模糊是魯棒的。 我們的框架不需要額外的監督,因為它直接針對物體檢測效能優化取樣位置。 我們的STSN效能優於ImageNet VID資料集的最新技術水平,與之前的視訊物件檢測方法相比,它採用更簡單的設計,並且不需要光流資料進行培訓。 我們還表明,在對視訊進行STSN訓練之後,我們可以通過在靜止影象資料上新增和訓練單個可變形的卷積層來適應影象中的物件檢測。 與傳統的影象中的物體檢測相比,這可以提高精確度。

arXiv:https://arxiv.org/abs/1803.05549

目標跟蹤

[10]《A Structural Correlation Filter Combined with A Multi-task Gaussian Particle Filter for Visual Tracking》

Abstract:在本文中,我們提出了一種新穎的結構相關濾波器與多工高斯粒子濾波器(KCF-GPF)模型相結合的魯棒視覺跟蹤。我們首先提出一種組裝結構,其中幾個KCF跟蹤器作為弱專家為高斯粒子濾波器提供初步決策,以作出最終決定。所提出的方法旨在利用和補充KCF和高斯粒子濾波器的強度。與基於相關濾波器或粒子濾波器的現有跟蹤方法相比,所提出的跟蹤器具有多個優點。首先,它可以通過弱KCF跟蹤器檢測大規模搜尋範圍內的跟蹤目標,並評估高斯粒子濾波器的弱跟蹤器\ rq決策的可靠性,從而做出強有力的決策,因此它可以解決快速運動,外觀變化,遮擋和重新檢測。其次,它可以通過高斯粒子濾波器有效處理大範圍的變化。第三,可以採用重取樣的方式完全並行實現而不需重取樣,因此便於VLSI的實施,並且可以降低計算成本。在包含50個具有挑戰性的序列的OTB-2013資料集上進行的大量實驗證明,所提出的演算法對16個最先進的跟蹤器

arXiv:https://arxiv.org/abs/1803.05845

-------我是可愛的分割線-------  

若喜歡Amusi推送的文章,請持續關注CVer公眾號!