1. 程式人生 > >卷積神經網路應用之影象分割

卷積神經網路應用之影象分割

FNC

  FNC主要做的是基於畫素的影象分割預測。其做法是先按照傳統的CNN結構得到feature map,將傳統的全連線層替換成相應的卷積層。如最後一層特徵圖尺寸為55512,對應的全連線層的尺寸為4096,則需要555124096個引數,將該引數變成卷積核,kernel size 為5*5,input channels 為512, output channels 為4096,依此將傳統的帶有卷積層和全連線層的網路變成全連線神經網路。

  FNC的一個好處是它的輸入可以是任意大小的。傳統的CNN結構是在最後一個特徵圖的全連線層是需要固定大小的,比如上面的

555124096這裡就確定了最後的特徵圖尺寸是55512傳統網路如果想要任意輸入,就需要用一個類似SPP(Spatial Pyramid Pooling)的結構。該結構的大概過程就是通過不同層級(大小)的網格劃分圖片,在每個網格中做Pooling操作,再將每個網格得出來的值疊起來得到一個固定長度的向量,進入我們的全連線層。


CPP結構

  SPP的工作流程圖大概如上,該例圖將圖片分成3層,第一層用44的網格劃分,第二層用22的網格劃分,第三層把整個圖片分為1塊。則共有16+4+1=21個網格塊,通過對每個網格塊進行Pooling操作可以得到21個輸出可以用於全連線層。我們可以通過增加層級,以及改變每層的網格數得到不一樣的input channels。

U-Net


U-Net網路架構設計

該網路初始用於醫療影象領域,目的是獲得影象的邊緣。
圖中,藍色代表卷積和啟用函式,灰色代表複製,紅色代表下采樣,綠色代表上取樣。

Autoencoder