卷積神經網路應用之影象分割
阿新 • • 發佈:2019-02-05
FNC
FNC主要做的是基於畫素的影象分割預測。其做法是先按照傳統的CNN結構得到feature map,將傳統的全連線層替換成相應的卷積層。如最後一層特徵圖尺寸為,對應的全連線層的尺寸為4096,則需要個引數,將該引數變成卷積核,kernel size 為5*5,input channels 為512, output channels 為4096,依此將傳統的帶有卷積層和全連線層的網路變成全連線神經網路。
FNC的一個好處是它的輸入可以是任意大小的。傳統的CNN結構是在最後一個特徵圖的全連線層是需要固定大小的,比如上面的 這裡就確定了最後的特徵圖尺寸是。傳統網路如果想要任意輸入,就需要用一個類似SPP(Spatial Pyramid Pooling)的結構。該結構的大概過程就是通過不同層級(大小)的網格劃分圖片,在每個網格中做Pooling操作,再將每個網格得出來的值疊起來得到一個固定長度的向量,進入我們的全連線層。
SPP的工作流程圖大概如上,該例圖將圖片分成3層,第一層用的網格劃分,第二層用的網格劃分,第三層把整個圖片分為1塊。則共有個網格塊,通過對每個網格塊進行Pooling操作可以得到21個輸出可以用於全連線層。我們可以通過增加層級,以及改變每層的網格數得到不一樣的input channels。
U-Net
該網路初始用於醫療影象領域,目的是獲得影象的邊緣。
圖中,藍色代表卷積和啟用函式,灰色代表複製,紅色代表下采樣,綠色代表上取樣。