論文分析--《基於深度學習的人臉表情識別演算法研究_宋新慧》
1.摘要:
文章中提出的演算法:
1)針對靜態的影象:細節感知遷移網路
資料集:CK+;Kaggle
2)針對視訊序列:利用多工學習的遞迴神經網路
資料集:I-PFE
2.本文工作:
1)基於細節感知遷移網路的人臉表情識別:
傳統特徵提取方法存在的問題:光照、角度等影響
解決問題的方法:對抗網路(擴充資料集)+細節感知遷移網路(卷積神經網路)
2)基於視訊序列的多工遞迴神經網路結構:
編碼網路+時間遞迴神經網路+人臉身份識別網路+人臉表情識別網路
3.綜述:
1)基於深度學習的人臉檢測方法:
R-CNN:
SPP-Net : 解決輸入影象大小固定的問題
Fast R-CNN : 解決所有候選區都要輸入網路模型的問題
FacenessNet :專門用於人臉檢測
2)人臉對齊方法:
基於模型的人臉對齊方法:ASM AAM
基於線性迴歸的人臉對齊方法:
基於非線性迴歸的人臉對齊方法:
3)人臉表情特徵提取方法:
Haar特徵:
LBP特徵:區域性二進位制模板
4)人臉表情識別方法:
針對影象中的靜態人臉表情識別:Bayes分類演算法、SVM、AdaBoost、基於CNN分類演算法
針對動態視訊中的動態人臉表情識別:HMM(隱馬爾可夫)模型
基於深度學習的人臉表情識別方法:
4.基於細節感知遷移網路的人臉表情識別方法:
1)人臉表情資料集:
CK+:123個物件的327個被標記的表情圖片序列、七種表情
Kaggle:28709張訓練樣本、3859張驗證資料集、3859張測試樣本、七種表情
2)基於對抗網路的資料集擴充:
基本思想:生成的資料與樣本資料儘量相似
D:輸出相似概率,越高越好 G:輸出生成資料與樣本的差異,越小越好
G網路:
100維噪聲--->卷積--->反捲積(ReLU啟用函式)--->64*64影象
反捲積:2*2--->4*4 特徵對映
D網路:
每層用LeakyReLU啟用函式
3)細節感知遷移網路結構:
Batch Normalization(批規範化):歸一化啟用操作前的輸入值
殘差網路:解決網路深度加深而準確度降低的問題
Dropout:一種歸一化技術,隨機丟掉一些隱藏節點,減少不同節點之間的相互作用
4)網路學習:
計算梯度(用來執行引數更新)的方法:SGD、AdaGrad、Adam
5)基於多網路融合的人臉表情識別:
基於區域融合的人臉表情識別:三個區域,SVM分類
基於提升的人臉表情識別:三個級聯的網路結構(兩層俊基神經網路,第三個為DPTL網路)
6)實驗結果:
基於細節感知遷移網路的實驗結果:
基於網路融合和網路提升的實驗結果:
5.基於視訊序列的多工遞迴神經網路人臉表情識別:
1)遞迴神經網路(RNN)