損失函式改進之Center Loss

阿新 • • 發佈：2019-02-20

最近幾年網路效果的提升除了改變網路結構外，還有一群人在研究損失層的改進，這篇博文要介紹的就是較為新穎的center loss。center loss來自ECCV2016的一篇論文：A Discriminative Feature Learning Approach for Deep Face Recognition。
論文連結：http://ydwen.github.io/papers/WenECCV16.pdf
程式碼連結：https://github.com/pangyupo/mxnet_center_loss

對於常見的影象分類問題，我們常常用softmax loss來求損失，關於softmax loss你可以參考這篇博文：

softmax，softmax-loss，BP的解釋。如果你的損失採用softmax loss，那麼最後各個類別學出來的特徵分佈大概如下圖Fig2。這個圖是以MNISTt資料集做的實驗，一共10個類別，用不同的顏色表示。從Fig2可以看出不管是訓練資料集還是測試資料集，都能看出比較清晰的類別界限。

這裡寫圖片描述

如果你是採用softmax loss加上本文提出的center loss的損失，那麼最後各個類別的特徵分佈大概如下圖Fig3。和Fig2相比，類間距離變大了，類內距離減少了（主要變化在於類內距離：intra-class），這就是直觀的結果。

這裡寫圖片描述

接下來詳細介紹center loss。如果你還是不熟悉傳統的softmax loss，那麼先來看看傳統的softmax loss。首先區分softmax和softmax loss的區別，可以看部落格：

softmax，softmax-loss，BP的解釋。下面公式1中log函式的輸入就是softmax的結果（是概率），而Ls表示的是softmax loss的結果（是損失）。wx+b是全連線層的輸出，因此log的輸入就表示xi屬於類別yi的概率。

這裡寫圖片描述

那麼center loss到底是什麼呢？先看看center loss的公式LC。cyi表示第yi個類別的特徵中心，xi表示全連線層之前的特徵。後面會講到實際使用的時候，m表示mini-batch的大小。因此這個公式就是希望一個batch中的每個樣本的feature離feature 的中心的距離的平方和要越小越好，也就是類內距離要越小越好。這就是center loss。

這裡寫圖片描述

關於LC的梯度和cyi的更新公式如下：

這裡寫圖片描述

這個公式裡面有個條件表示式如下式，這裡當condition滿足的時候，下面這個式子等於1，當不滿足的時候，下面這個式子等於0.

這裡寫圖片描述

因此上面關於cyi的更新的公式中，當yi（表示yi類別）和cj的類別j不一樣的時候，cj是不需要更新的，只有當yi和j一樣才需要更新。

作者文中用的損失L的包含softmax loss和center loss，用引數南木達（打不出這個特殊字元）控制二者的比重，如下式所示。這裡的m表示mini-batch的包含的樣本數量，n表示類別數。

這裡寫圖片描述

具體的演算法描述可以看下面的Algorithm1：

這裡寫圖片描述

損失函式改進之Center Loss

損失函式改進之Center Loss

生成模型--損失函式改進之WGAN系列

損失函式改進方法之A-softmax loss

人臉驗證（四）--CenterLoss，損失函式改進原因人臉驗證（四）--CenterLoss

損失函式改進總結

迴歸損失函式2 ： HUber loss,Log Cosh Loss,以及 Quantile Loss

【Kaggle-MNIST之路】CNN結構再改進+交叉熵損失函式（六）

【調參之損失函式】train loss 和 test loss 一直不下降

損失函式loss改進解析

【Kaggle-MNIST之路】CNN+改進過的損失函式（三）

人臉識別：損失函式之softmax loss和cross entropy Loss

pytorch系列12 --pytorch自定義損失函式custom loss function

深度學習基礎--loss與啟用函式--合頁損失函式、摺頁損失函式；Hinge Loss；Multiclass SVM Loss

深度學習基礎--loss與啟用函式--sigmiod與softmax；對數損失函式與交叉熵代價函式

線性支援向量機-合頁損失函式(Hinge Loss)

tensorflow之損失函式:sparse_softmax_cross_entropy_with_logits 與 softmax_cross_entropy_with_logits的區別

關於機器學習中的損失函式loss function

COCO loss （人臉識別損失函式）

faster rcnn中損失函式（二）—— Smoooh L1 Loss的講解

損失函式 loss function 總結（轉）

損失函式改進之Center Loss

相關推薦