全卷積神經網路FCN
阿新 • • 發佈:2021-11-08
以Alexnet和VGGnet為例,設計好之後,輸入圖片的大小是有固定要求的.
全卷積神經網路FCN,可以輸入任意大小的圖片來作為輸入.
全卷積神經網路顧名思義,即該網路中全部使用卷積層進行連線.
卷積神經網路簡單結構示意可以表示為:輸入>>>卷積層>>>Flatten>>>全連線層>>>輸出
全卷積神經網路無需Flatten操作,其結構可以簡單的表示為: 輸入>>>卷積層>>>卷積層(卷積核大小為1*1)>>>輸出
1*1卷積核
作用:
(1)增加非線性,該卷積核的卷積過程相當於全連線的計算過程,並且還加入了非線性啟用函式,從而可以增加網路的非線性,使得網路可以表達更加複雜的特徵.
(2)特徵降維,通過控制卷積核的數量達到通道數大小的縮放.
(3)實現跨通道的互動和資訊整合(具有線性修正特性,實現多個feature map的線性組合,可以實現feature map在通道數上的變化,想象成跨通道的pooling,)
該卷積核只有一個引數,在圖片上進行滑動,相當於給輸入資料乘上一個係數(對於單通道核單個卷積核而言是可以這樣理解的),該卷積核可以看作一種全連線,例如:
例如:第一層有六個神經元分別從a1-a6,通過全連線以後,到第二次變成五個神經元,分別是b1-b5,第一層的6各神經元需要和第二層的5個神經元進行全連線,其中b1為a1-a6的加權和,權數對應於就是w1-w6,第一層的6個神經元其實相當於輸入特徵的通道數:6,而第二層的5個神經元相當於1*1卷積之後的新的特徵通道數:5.w1-w6是一個卷積核的權係數,顯然要計算b2-b5還需要4個尺度相同的卷積核.
由於沒有了全連線層的限制,所以卷積層的輸入可以接受不同尺寸的影象,也就不要求輸入訓練和測試影象的尺寸一樣了.