人臉識別損失函式疏理與分析

阿新 • • 發佈：2020-08-04

[TOC] 部落格：[部落格園](https://www.cnblogs.com/shine-lee/) | [CSDN](https://blog.csdn.net/blogshinelee) | [blog](https://blog.shinelee.me/) # 寫在前面 Closed-set 和 Open-set 人臉識別的對比如下， ![Comparison-of-open-set-and-closed-set-face-recognition.png](https://gitee.com/shinelee/ImgBed/raw/master/2020/人臉識別中的損失函式/Comparison-of-open-set-and-closed-set-face-recognition.png) 兩張人臉影象，分別提取特徵，通過計算特徵向量間的距離（相似度）來判斷它們是否來自同一個人。**選擇與問題背景相契合的度量方式很重要**，人臉識別中一般有兩種，**歐氏距離**和**餘弦距離（角度距離）**。訓練階段和測試階段採用的度量方式要一致，如果想在測試階段使用歐氏距離，自然在訓練階段就要基於歐氏距離來構造損失進行優化。實際上，不同度量方式間存在著一定的內在聯絡， - **歐氏距離與向量的模和角度都有關**，模固定，角度越大歐氏距離也越大，角度固定，模同比增大歐式距離也增大，模分別增大情況會比較複雜； - **餘弦距離和角度距離有單調關係**（負相關），但兩者分佈的“密度”不同，觀察餘弦函式曲線可知，在角度從0向$\pi$勻速（線性）前進時，餘弦值在0和$\pi$附近緩慢變化，在$\frac{\pi}{2}$附近近似線性變化 - **當向量模長歸一化後，歐氏距離和餘弦距離有單調關係**，所以，在預測階段，歸一化後的特徵選取哪種度量進行判別均可可對不同損失函式按度量方式進行劃分， - **歐氏距離**：Contrastive Loss，Triplet Loss，Center Loss…… - **餘弦距離（角度距離）**：Large-Margin Softmax Loss，Angular-Softmax Loss，Large Margin Cosine Loss，Additive Angular Margin Loss…… 先從最基本的Softmax Loss開始。 # Cross-Entropy Loss (softmax loss) 交叉熵損失，也稱為softmax損失，是深度學習中應用最廣泛的損失函式之一。 $$ \mathcal{L}_{\mathrm{s}}=-\frac{1}{N_b} \sum_{i=1}^{N_b} \log \frac{e^{W_{y_{i}}^{T} x_{i}+b_{y_{i}}}}{\sum_{j=1}^{n} e^{W_{j}^{T} x_{i}+b_{j}}} $$ 其中， - $n$個類別，$N_b$為batch size - $x_{i} \in \mathbb{R}^{d}$，第$i$個樣本的特徵，特徵有$d$維，屬於$y_i$類 - $W \in \mathbb{R}^{d \times n}$為權重矩陣，$W_j$表示$W$的第$j$列，$b_{j} \in \mathbb{R}^{n}$為bias 特徵$x$經全連線層的權重矩陣$W$得到與類別數相同的$n$個$(-\infty, +\infty)$實數，相對越大的實數代表越像某一個類別，Softmax的作用是將$(-\infty, +\infty)$的$n$個實數通過**指數**對映到$(0, +\infty)$，然後歸一化，使和為1，以獲得某種概率解釋。 **指數操作會將對映前的小差異指數放大**，Softmax Loss希望label對應的項越大越好，但因為指數操作的存在，只需要對映前差異足夠大即可，並不需要使出“全力”。在人臉識別中，可通過對人臉分類來驅動模型學習人臉的特徵表示。但**該損失追求的是類別的可分性，並沒有顯式最優化類間和類內距離**，這啟發了其他損失函式的出現。 # Contrastive Loss - CVPR2006 Contrastive Loss由LeCun在[《Dimensionality Reduction by Learning an Invariant Mapping》CVPR2006](http://yann.lecun.com/exdb/publis/pdf/hadsell-chopra-lecun-06.pdf)中提出，起初是希望降維後的樣本保持原有距離關係，相似的仍相似，不相似的仍不相似，如下所示， $$ \begin{array}{c} L\left(W, Y, \vec{X}_{1}, \vec{X}_{2}\right)= (1-Y) \frac{1}{2}\left(D_{W}\right)^{2}+(Y) \frac{1}{2}\left\{\max \left(0, m-D_{W}\right)\right\}^{2} \end{array} $$ 其中，$\vec{X}_{1}$和$\vec{X}_{2}$為樣本對，$Y=\{0， 1\}$指示樣本對是否相似，$Y=0$相似，$Y=1$不相似，$D_W$為樣本對特徵間的歐氏距離，$W$為待學習引數。相當於歐氏距離損失+Hinge損失 ![Graph-of-Contrastive-Loss.png](https://gitee.com/shinelee/ImgBed/raw/master/2020/人臉識別中的損失函式/Graph-of-Contrastive-Loss.png) 類內希望距離越小越好，類間希望越大越好（大於margin），這恰與人臉識別特徵學習的目的相一致。Contrastive Loss在[DeepID2](https://arxiv.org/abs/1406.4773)中得以使用，作為Verification Loss，與Softmax Loss形式的Identification Loss構成聯合損失，如下所示， $$ \operatorname{Ident}\left(f, t, \theta_{i d}\right)=-\sum_{i=1}^{n}-p_{i} \log \hat{p}_{i}=-\log \hat{p}_{t} \\ \operatorname{Verif}\left(f_{i}, f_{j}, y_{i j}, \theta_{v e}\right)=\left\{\begin{array}{ll} \frac{1}{2}\left\|f_{i}-f_{j}\right\|_{2}^{2} & \text { if } y_{i j}=1 \\ \frac{1}{2} \max \left(0, m-\left\|f_{i}-f_{j}\right\|_{2}\right)^{2} & \text { if } y_{i j}=-1 \end{array}\right. $$ **這種Softmax Loss + 其他損失構成的聯合損失比較常見，通過引入Softmax Loss可以讓訓練更穩定，更容易收斂。** # Triplet Loss - CVPR2015 Contrastive Loss的輸入是一對樣本。 Triplet Loss的輸入是3個樣本，1對正樣本（同一個人），1對負樣本（不同人），希望拉近正樣本間的距離，拉開負樣本間的距離。Triplet Loss出自[《FaceNet: A Unified Embedding for Face Recognition and Clustering》](http://arxiv.org/abs/1503.03832)。 ![triplet-loss.png](https://gitee.com/shinelee/ImgBed/raw/master/2020/人臉識別中的損失函式/triplet-loss.png) 損失函式如下， $$ \mathcal{L}_t = \sum_{i}^{N}\left[\left\|f\left(x_{i}^{a}\right)-f\left(x_{i}^{p}\right)\right\|_{2}^{2}-\left\|f\left(x_{i}^{a}\right)-f\left(x_{i}^{n}\right)\right\|_{2}^{2}+\alpha\right]_{+} $$ 該損失希望在拉近正樣本、拉開負樣本的同時，有一個margin， $$ \left\|f\left(x_{i}^{a}\right)-f\left(x_{i}^{p}\right)\right\|_{2}^{2}+\alpha<\left\|f\left(x_{i}^{a}\right)-f\left(x_{i}^{n}\right)\right\|_{2}^{2} $$ Softmax Loss最後的全連線層引數量與人數成正比，在大規模資料集上，對視訊記憶體提出了挑戰。 Contrastive Loss和Triplet Loss的輸入為pair和triplet，方便在大資料集上訓練，但pair和triplet挑選有難度，訓練不穩定難收斂，可與Softmax Loss搭配使用，或構成聯合損失，或一前一後，用Softmax Loss先“熱身”。 # Center Loss - ECCV2016 因為人臉表情和角度的變化，同一個人的類內距離甚至可能大於不同人的類間距離。Center Loss的出發點在於，**不僅希望類間可分，還希望類內緊湊**，前者通過Softmax loss實現，後者通過Center Loss實現，如下所示，為每個類別分配一個**可學習的類中心**，計算每個樣本到各自類中心的距離，距離之和越小表示類內越緊湊。 $$ \mathcal{L}_{c e}=\frac{1}{2} \sum_{i=1}^{N}\left\|x_{i}-c_{y_{i}}\right\|_{2}^{2} $$ 聯合損失如下，通過超引數$\lambda$來平衡兩個損失，並給兩個損失分配不同的學習率， $$ \begin{aligned} L_{c} &=L_{s}+\lambda L_{c e} \\ &=-\sum_{i=1}^{N_{b}} \log \frac{e^{W_{y_{i}}^{T} x_{i}+b_{y_{i}}}}{\sum_{j=1}^{n} e^{W_{j}^{T} x_{i}+b_{j}}}+\frac{\lambda}{2} \sum_{i=1}^{N_b}\left\|x_{i}-c_{y_{i}}\right\|_{2}^{2} \end{aligned} $$ ![center-loss-algorithm.png](https://gitee.com/shinelee/ImgBed/raw/master/2020/人臉識別中的損失函式/center-loss-algorithm.png) 希望達成的效果如下， ![center-loss-distribution-of-features.png](https://gitee.com/shinelee/ImgBed/raw/master/2020/人臉識別中的損失函式/center-loss-distribution-of-features.png) 以上損失在歐氏距離上優化，下面介紹在餘弦距離上優化的損失函式。 # L-Softmax Loss - ICML2016 L-Softmax 即 large-margin softmax，出自[《Large-Margin Softmax Loss for Convolutional Neural Networks》](https://arxiv.org/abs/1612.02295v4)。若忽略bias，FC+softmax+cross entropy可寫成如下形式， $$ L_{i}=-\log \left(\frac{e^{\left\|\boldsymbol{W}_{y_{i}}\right\|\left\|\boldsymbol{x}_{i}\right\| \cos \left(\theta_{y_{i}}\right)}}{\sum_{j} e^{\left\|\boldsymbol{W}_{j}\right\|\left\|\boldsymbol{x}_{i}\right\| \cos \left(\theta_{j}\right)}}\right) $$ **可將$\boldsymbol{W}_{j}$視為第$j$類的類中心向量**，對$x_i$，希望$\left\|\boldsymbol{W}_{y_{i}}\right\|\left\|\boldsymbol{x}_{i}\right\| \cos \left(\theta_{y_{i}}\right)$相比$\left\|\boldsymbol{W}_{j}\right\|\left\|\boldsymbol{x}_{i}\right\| \cos \left(\theta_{j}\right), j \neq y_i$越大越好，有兩個影響因素， - $\boldsymbol{W}$每一列的模 - $\boldsymbol{x}_i$與$\boldsymbol{W}_j$的夾角 L-Softmax主要關注在第2個因素 **夾角**上，相比Softmax，希望$\boldsymbol{x}_i$與$\boldsymbol{W}_{y_i}$靠得更近，於是對$\cos \left(\theta_{y_{i}}\right)$施加了更強的約束，對角度$\theta_{y_i}$乘上個因子$m$，**如果想獲得與Softmax相同的內積值，需要$\theta_{y_i}$更小**， $$ L_{i}=-\log \left(\frac{e^{\left\|\boldsymbol{W}_{y_{i}}\right\|\left\|\boldsymbol{x}_{i}\right\| \psi\left(\theta_{y_{i}}\right)}}{e^{\left\|\boldsymbol{W}_{y_{i}}\right\|\left\|\boldsymbol{x}_{i}\right\| \psi\left(\theta_{y_{i}}\right)}+\sum_{j \neq y_{i}} e^{\left\|\boldsymbol{W}_{j}\right\|\left\|\boldsymbol{x}_{i}\right\| \cos \left(\theta_{j}\right)}}\right) $$ 為此，需要構造$\psi(\theta)$，需滿足如下條件 - $\psi(\theta) < cos(\theta)$ - 單調遞減文中構造的$\psi(\theta)$如下，通過$m$調整margin大小 $$ \psi(\theta)=(-1)^{k} \cos (m \theta)-2 k, \quad \theta \in\left[\frac{k \pi}{m}, \frac{(k+1) \pi}{m}\right], k \in [0, m-1] $$ 當$m=2$時，如下所示， ![L-Softmax-phi.png](https://gitee.com/shinelee/ImgBed/raw/master/2020/人臉識別中的損失函式/L-Softmax-phi.png) 二分類情況下，結合解釋如下， ![L-Softmax-Geometric-Interpretation.png](https://gitee.com/shinelee/ImgBed/raw/master/2020/人臉識別中的損失函式/L-Softmax-Geometric-Interpretation.png) 為了梯度計算和反向傳播，將$\cos(\theta)$替換為僅包含$W$和$w_i$的表示式$\frac{\boldsymbol{W}_{j}^{T} \boldsymbol{x}_{i}}{\left\|\boldsymbol{W}_{j}\right\|\left\|\boldsymbol{x}_{i}\right\|}$，通過倍角公式計算$\cos(m \theta)$， $$ \begin{aligned} \cos \left(m \theta_{y_{i}}\right) &=C_{m}^{0} \cos ^{m}\left(\theta_{y_{i}}\right)-C_{m}^{2} \cos ^{m-2}\left(\theta_{y_{i}}\right)\left(1-\cos ^{2}\left(\theta_{y_{i}}\right)\right) \\ &+C_{m}^{4} \cos ^{m-4}\left(\theta_{y_{i}}\right)\left(1-\cos ^{2}\left(\theta_{y_{i}}\right)\right)^{2}+\cdots \\ &(-1)^{n} C_{m}^{2 n} \cos ^{m-2 n}\left(\theta_{y_{i}}\right)\left(1-\cos ^{2}\left(\theta_{y_{i}}\right)\right)^{n}+\cdots \end{aligned} $$ 同時，為了便於訓練，定義超引數$\lambda$，將$\left\|\boldsymbol{W}_{y_{i}}\right\|\left\|\boldsymbol{x}_{i}\right\| \psi\left(\theta_{y_{i}}\right)$替換為$f_{y_i}$， $$ f_{y_{i}}=\frac{\lambda\left\|\boldsymbol{W}_{y_{i}}\right\|\left\|\boldsymbol{x}_{i}\right\| \cos \left(\theta_{y_{i}}\right)+\left\|\boldsymbol{W}_{y_{i}}\right\|\left\|\boldsymbol{x}_{i}\right\| \psi\left(\theta_{y_{i}}\right)}{1+\lambda} $$ 訓練時，從較大的$\lambda$開始，然後逐漸減小，近似於用Softmax“熱身”。 # A-Softmax Loss - CVPR2017 A-Softmax即Angular-Softmax，出自[《SphereFace: Deep Hypersphere Embedding for Face Recognition》](https://arxiv.org/abs/1704.08063)。 L-Softmax中，在對$x_i$歸類時，會同時考慮類**中心向量的模**和**夾角**。 A-Softmax的最大差異在於**對每個類中心向量進行歸一化**，即令$||W_j|| = 1$，同時令bias為0，**在分類時只考慮$x_i$和$W_j$的夾角**，並引入和L-Softmax相同的margin，如下所示， $$ \mathcal{L}_{\mathrm{AS}}=-\frac{1}{N} \sum_{i=1}^{N} \log \left(\frac{e^{\left\|\boldsymbol{x}_{i}\right\| \psi\left(\theta_{y_{i}, i}\right)}}{e^{\left\|\boldsymbol{x}_{i}\right\| \psi\left(\theta_{y_{i}, i}\right)}+\sum_{j \neq y_{i}} e^{\left\|\boldsymbol{x}_{i}\right\| \cos \left(\theta_{j, i}\right)}}\right) \\ \psi(\theta_{y_i, i})=(-1)^{k} \cos (m \theta_{y_i, i})-2 k, \quad \theta_{y_i, i} \in\left[\frac{k \pi}{m}, \frac{(k+1) \pi}{m}\right], k \in [0, m-1] $$ 當$m=1$時，即不引入margin時，稱之為 **modified softmax loss**。 Softmax Loss、Modified Softmax Loss和A-Softmax Loss，三者的決策面如下， ![A-Softmax-decision-boundaries.png](https://gitee.com/shinelee/ImgBed/raw/master/2020/人臉識別中的損失函式/A-Softmax-decision-boundaries.png) 視覺化如下， ![A-Softmax-Geometry-Interpretation.png](https://gitee.com/shinelee/ImgBed/raw/master/2020/人臉識別中的損失函式/A-Softmax-Geometry-Interpretation.png) # AM-Softmax Loss-CVPR2018 AM-Softmax即Additive Margin Softmax，出自論文[《Additive Margin Softmax for Face Verification》](https://arxiv.org/abs/1801.05599)，同CosFace [《CosFace: Large Margin Cosine Loss for Deep Face Recognition》](https://arxiv.org/abs/1801.09414)，CosFace中損失名為LMCL（Large Margin Cosine Loss）。與A-Softmax相比，有2點變化， - **對$x_i$也做歸一化**，同時保留對$W$每一列的歸一化以及bias為0 - 將$\cos(m \theta)$變成$s \cdot (\cos \theta - m)$ $$ \mathcal{L}_{\mathrm{AM}}=-\frac{1}{N} \sum_{i=1}^{N} \log \frac{e^{s \cdot\left(\cos \theta_{y_{i}}-m\right)}}{e^{s \cdot\left(\cos \theta_{y_{i}}-m\right)}+\sum_{j=1, j \neq y_{i}}^{c} e^{s \cdot \cos \theta_{j}}} $$ 相比Softmax，希望獲得更大的類間距離和更小類內距離，如果採用的是餘弦距離，意味著，要想獲得與Softmax相同的$y_i$對應的分量，需要更小的夾角$\theta$，為此需要構建$\psi(\theta)$，如前所述，需要 - $\psi(\theta) < cos(\theta)$ - 單調遞減前面構建的$\psi(\theta)$，始於$\cos(m \theta)$，$m$與$\theta$是乘的關係，這裡令$\varphi(\theta)= s(\cos (\theta)-m)$， - $\cos(\theta) - m$：$m$變乘法為加法，$\cos(m\theta)$將margin作用在角度上，$\cos(\theta) - m$直接作用在餘弦距離上，前者的問題在於**對類中心向量夾角較小的情況懲罰較小**，夾角小則margin會相對更小，同時計算複雜，後者可以看成是**Hard Margin Softmax**，希望在保證類間“硬”間距的情況下學習特徵對映。 ![Additive-Margin.png](https://gitee.com/shinelee/ImgBed/raw/master/2020/人臉識別中的損失函式/Additive-Margin.png) - $s$：將$x_i$也歸一化後，相當於**將特徵嵌入到單位超球上，表徵空間有限**，特徵和權重歸一化後$\mid \boldsymbol{W}_{j}\|\| \boldsymbol{x}_{i} \| \cos \left(\theta_{ij}\right)=cos(\theta_{ij})$的值域為$[-1, 1]$，即$x_i$到每個類中心向量的餘弦距離，最大為1，最小為-1，Softmax 指數歸一化前，**各類的分量差異過小**，所以要乘個因子$s$，將**特徵對映到半徑為$s$的超球上，放大表徵空間，拉開各分量的差距。** ![AM-Softmax-visualization.png](https://gitee.com/shinelee/ImgBed/raw/master/2020/人臉識別中的損失函式/AM-Softmax-visualization.png) # ArcFace Loss - CVPR2019 ArcFace Loss 即 Additive Angular Margin Loss，出自[《ArcFace: Additive Angular Margin Loss for Deep Face Recognition》](https://arxiv.org/abs/1801.07698)。 AM-Softmax Loss將margin作用在餘弦距離上，與之不同的是，ArcFace將margin作用在角度上，其損失函式如下， $$ \mathcal{L}_{\mathrm{AF}}=-\frac{1}{N} \sum_{i=1}^{N} \log \frac{e^{s \cdot\left(\cos \left(\theta_{y_{i}}+m\right)\right)}}{e^{s \cdot\left(\cos \left(\theta_{y_{i}}+m\right)\right)}+\sum_{j=1, j \neq y_{i}}^{n} e^{s \cdot \cos \theta_{j}}} $$ ![ArcFace.png](https://gitee.com/shinelee/ImgBed/raw/master/2020/人臉識別中的損失函式/ArcFace.png) 把margin是加在餘弦距離（CosFace）還是加在角度（ArcFace）上，在[《Additive Margin Softmax for Face Verification》](https://arxiv.org/abs/1801.05599)中有這樣一段分析， ![Angular-Margin-or-Cosine-Margin.png](https://gitee.com/shinelee/ImgBed/raw/master/2020/人臉識別中的損失函式/Angular-Margin-or-Cosine-Margin.png) **ArcFace中並沒有求取arccos，所以計算並不複雜，而是把margin加在了角度上，但優化的仍是餘弦距離。** 還有一點需要注意的是，無論margin是加在餘弦距離上還是加在角度上，單純看示意圖，很容易看出減少了類內距離，那類間距離增加呢？文中，給出了類內距離和類間距離的數學描述，如下： $$ L_{Intra}=\frac{1}{\pi N} \sum_{i=1}^{N} \theta_{y_{i}} \\ L_{Inter}=-\frac{1}{\pi N(n-1)} \sum_{i=1}^{N} \sum_{j=1, j \neq y_{i}}^{n} \arccos \left(W_{y_{i}}^{T} W_{j}\right) $$ $W$是待學習的引數，特徵$x_i$也是通過前面層的權重學習得到，在訓練過程中$x_i$和$W$都會發生變化，都會被梯度驅使著向Loss減小的方向移動。margin的引入有意壓低了類標籤對應分量的值，去儘量“壓榨”模型的潛力，在softmax中原本可以收斂的位置還需要繼續下降，下降可以通過提高類標籤對應分量的值，也可以通過降低其他分量的值。所以，$x_i$在向$W_{y_i}$靠近的同時，$W_j, j\neq y_i$也可能在向遠離$x_i$的方向移動，最終達成的效果就可能是$x_i$儘可能地靠近$W_{y_i}$，而$W_j, j\neq y_i$原理了$W_{y_i}$。 # 歐氏距離or角度距離與歸一化這裡，再討論下為什麼對$W$和$x$的模進行歸一化，主觀思考偏多，未經驗證。在文章[為什麼要做特徵歸一化/標準化？](https://www.cnblogs.com/shine-lee/p/11779514.html)中，我們提到， > **歸一化/標準化的目的是為了獲得某種“無關性”——偏置無關、尺度無關、長度無關……當歸一化/標準化方法背後的物理意義和幾何含義與當前問題的需要相契合時，其對解決該問題就有正向作用，反之，就會起反作用。** 特徵$x$與$W$每個類中心向量內積的結果，取決於$x$的模、$W_j$的模以及它們的夾角，模的大小和夾角的大小都將影響內積結果的大小。 - 對$W_j$歸一化：如果訓練集存在較嚴重的**類別不均衡**，網路將傾向於把輸入影象劃分到圖片數量多的類別，這種傾向將反映在類中心向量的模上，即圖片數量多的類別其類中心向量的模將偏大，這一點論文[One-shot Face Recognition by Promoting Underrepresented Classes](https://arxiv.org/abs/1707.05574)中有實驗驗證。所以，**對$W_j$的模歸一化相當於強迫網路同等看待每一個類別，相當於把同等看待每一個人的先驗做進網路，來緩解類別不均衡問題。** - 對$x$歸一化：對某一個具體的$x_i$，其與每個類中心的內積為 $x_i \cdot W_j = |x_i||W_j|\cos \theta_{ij} = |x_i|\cos \theta_{ij}$，因為每個類別的內積結果都含$x_i$的模，$x_i$的模是否歸一化似乎並不影響內積結果間的大小關係，但會影響損失的大小，比如內積結果分別為$[4,1,1,1]$，模同時放大1倍，變成$[8,2,2,2]$，經過Softmax的指數歸一化後，後者的損失更小。在[卷積神經網路之卷積計算、作用與思想](https://www.cnblogs.com/shine-lee/p/9932226.html)中，我們知道模式蘊含在卷積核的權重當中，特徵代表著與某種模式的相似程度，越相似響應越大。什麼樣的輸入影象容易得到模小的特徵，首先是數值尺度較小的輸入影象，這點可以通過對輸入影象做歸一化解決（如果輸入影象的歸一化不夠，對特徵進行歸一化可能可以緩解這個問題），然後是**那些模糊的、大角度的、有遮擋的人臉影象其特徵的模會較小**，這些圖在訓練集中相當於**困難樣本**，如果他們的數量不多，就可能會被簡單樣本淹沒掉。**從這個角度看，對$x$進行歸一化，可能可以讓網路相對更關注到這些困難樣本，去找到更細節的特徵，專注在角度上進行判別，進一步壓榨網路的潛能。**有點Focal Loss思想的感覺。網路會利用它可能利用上的一切手段來降低損失，有些手段可能並不是你所期望的，此時，通過融入先驗、新增正則等方式抑制那些你不希望網路採取的手段，修正網路進化的方式，以此讓網路朝著你期望的方向成長。以上。 # 參考 - [A Performance Comparison of Loss Functions for Deep Face Recognition](https://arxiv.org/abs/1901.05903) - [InsightFace: 2D and 3D Face Analysis Project](https://github.com/deepinsight/insightface) - [人臉識別的LOSS（上）](https://zhuanlan.zhihu.com/p/34404607) - [人臉識別的LOSS（下）](https://zhuanlan.zhihu.com/p/34436551) - [深度挖坑：從資料角度看人臉識別中Feature Normalization,Weight Normalization以及Triplet的

人臉識別損失函式疏理與分析

人臉識別損失函式疏理與分析

COCO loss （人臉識別損失函式）

人臉識別幾個解決方案分析與測評

人臉識別關鍵點/五官定位效果分析---點擊圖片提供下載測試，歡迎提供建議

tensorflow之損失函式:sparse_softmax_cross_entropy_with_logits 與 softmax_cross_entropy_with_logits的區別

基於深度學習的人臉識別AI技術謎與思（十四）--臉型識別

人臉識別sphereface,損失函式，論文詳解 SphereFace論文學習

cvHaarDetectObjects函式與人臉識別等應用

CVPR2018-騰訊AI Lab提出新型損失函式LMCL：可顯著增強人臉識別模型的判別能力

人臉識別：損失函式之softmax loss和cross entropy Loss

人臉識別之資料、網路結構、損失函式

騰訊技術工程 |騰訊AI Lab刷新人臉識別與檢測兩大測評國際記錄，技術日調用超六億

[DeeplearningAI筆記]卷積神經網絡4.1-4.5 人臉識別/one-shot learning/Siamase網絡/Triplet損失/將面部識別轉化為二分類問題

微信好友大揭秘，使用Python抓取朋友圈數據，通過人臉識別全面分析好友，一起看透你的“朋友圈”

人臉識別-arcface損失函數

python 與百度人臉識別api

《機器學習》筆記---2 模型的損失函式與正則化

深度學習基礎--loss與啟用函式--合頁損失函式、摺頁損失函式；Hinge Loss；Multiclass SVM Loss

深度學習基礎--loss與啟用函式--sigmiod與softmax；對數損失函式與交叉熵代價函式

人臉驗證（四）--CenterLoss，損失函式改進原因人臉驗證（四）--CenterLoss

人臉識別損失函式疏理與分析

相關推薦