1. 程式人生 > 實用技巧 >論文閱讀筆記《A semi-supervised CNN based method for steel surface defect recognition》

論文閱讀筆記《A semi-supervised CNN based method for steel surface defect recognition》

核心思想

  本文提出一種半監督的鋼鐵表面缺陷檢測方法(PLCNN),半監督的思路也比較常見,利用CNN對無標籤樣本進行預測,輸出偽標籤(Pseudo-Label),並將帶有偽標籤的樣本作為訓練樣本對網路進行進一步訓練。
在這裡插入圖片描述
  網路結構的設計也沒有什麼特別之處,唯一有點新意的地方可能就是損失函式的設計了。

實現過程

網路結構

  在這裡插入圖片描述

損失函式

  損失函式包含有標籤損失和無標籤損失兩個部分,兩個部分均採用交叉熵損失函式
在這裡插入圖片描述
在這裡插入圖片描述
其中最主要的就是平衡引數 α \alpha α的選擇,訓練前期偽標籤樣本並不可靠,所以 α \alpha α過大時就會導致無標籤損失對結果影響較大,使得網路效能無法提高;如果 α \alpha

α過小則會導致無標籤樣本對網路訓練起不到作用。因此本文采用了一個分段線性增長的 α \alpha α選擇策略,如下式
在這裡插入圖片描述
當訓練週期數小於 T 1 T_1 T1時, α \alpha α置0,使得無標籤損失不會對訓練產生負面影響,只依賴有標籤損失對網路進行訓練;當訓練週期數 T 1 < t < T 2 T_1<t<T_2 T1<t<T2時, α \alpha α隨週期數線性增長,這是因為隨著訓練的進行,偽標籤的準確性也在逐漸上升,所以穩定地增加無標籤損失的作用;當訓練週期數大於 T 2 T_2 T2時, α = α f \alpha=\alpha_f
α=αf
,無標籤損失的作用被限定在一定的範圍內,保證網路的訓練效果。

創新點

  • 提出一種半監督學習的缺陷檢測演算法,設計了線性的平衡引數增長策略

演算法評價

  中規中矩的一篇文章吧,但還是發表在了Q1區的頂刊裡,文章寫得比較規矩,思路並沒有什麼特別出彩的地方。

如果大家對於深度學習與計算機視覺領域感興趣,希望獲得更多的知識分享與最新的論文解讀,歡迎關注我的個人公眾號“深視”。在這裡插入圖片描述