論文閱讀筆記《A semi-supervised CNN based method for steel surface defect recognition》
阿新 • • 發佈:2020-10-23
核心思想
本文提出一種半監督的鋼鐵表面缺陷檢測方法(PLCNN),半監督的思路也比較常見,利用CNN對無標籤樣本進行預測,輸出偽標籤(Pseudo-Label),並將帶有偽標籤的樣本作為訓練樣本對網路進行進一步訓練。
網路結構的設計也沒有什麼特別之處,唯一有點新意的地方可能就是損失函式的設計了。
實現過程
網路結構
損失函式
損失函式包含有標籤損失和無標籤損失兩個部分,兩個部分均採用交叉熵損失函式
其中最主要的就是平衡引數
α
\alpha
α的選擇,訓練前期偽標籤樣本並不可靠,所以
α
\alpha
α過大時就會導致無標籤損失對結果影響較大,使得網路效能無法提高;如果
α
\alpha
α過小則會導致無標籤樣本對網路訓練起不到作用。因此本文采用了一個分段線性增長的
α
\alpha
α選擇策略,如下式
當訓練週期數小於
T
1
T_1
T1時,
α
\alpha
α置0,使得無標籤損失不會對訓練產生負面影響,只依賴有標籤損失對網路進行訓練;當訓練週期數
T
1
<
t
<
T
2
T_1<t<T_2
T1<t<T2時,
α
\alpha
α隨週期數線性增長,這是因為隨著訓練的進行,偽標籤的準確性也在逐漸上升,所以穩定地增加無標籤損失的作用;當訓練週期數大於
T
2
T_2
T2時,
α
=
α
f
\alpha=\alpha_f
α=αf,無標籤損失的作用被限定在一定的範圍內,保證網路的訓練效果。
創新點
- 提出一種半監督學習的缺陷檢測演算法,設計了線性的平衡引數增長策略
演算法評價
中規中矩的一篇文章吧,但還是發表在了Q1區的頂刊裡,文章寫得比較規矩,思路並沒有什麼特別出彩的地方。
如果大家對於深度學習與計算機視覺領域感興趣,希望獲得更多的知識分享與最新的論文解讀,歡迎關注我的個人公眾號“深視”。