分割網路 U-Net
U-Net: Convolutional Networks for Biomedical
Image Segmentation
U-net:作者提出了一種依賴於資料增強,使用少量標註資料更有效的網路和訓練策略。該架構包括了兩個路徑,一個是壓縮路徑去捕獲上下午,一個是對稱擴充套件路徑能夠更有效的定位。此外,在少量資料的基礎上,該網路實現了一種端到端的訓練。
在文章中,作者建立了一個全卷積網路,它使用少量的資料且產生更精確的分割結果。該網路是一個連續的壓縮網路,其中池化操作被上取樣操作代替,從而增加了輸入影象的解析度。為了定位,來自壓縮路徑的高解析度特徵與上取樣層結合。
該網路中重要的改進是在上採用部分,使用了大量的特徵通道(這允許網路繼承高解析度層的上下文資訊)
U-net中通過overlap-tile strategy策略來解決大影象在切割成小影象時邊緣分割不準確的問題。也就是說在切割成小圖片的時候,由於小圖片邊緣被人為切割,比如大影像中的建築物剛好被切割到兩張小圖片中,導致神經網路不能識別小圖片邊緣部分的建築物。直接切割,不採用影像重疊策略的效果如下圖所示,由於每張小圖片邊緣部分預測的效果比中間部分差很多,拼接後會產生明顯的裂痕感。使用該策略後,效果明顯提升,初賽時準確率提升在10%左右。影像重疊策略是在原始影像內部切割的時候進行重疊,在原始影像邊緣部分進行映象反射外推。如下圖所示,原始影像做映象反射外推padding=16,影像內部切割重疊部分padding=16,大的黃色框和紅色框是切割圖片時的大小,小的黃色框和紅色框是實際有用的區域(參考博文:
網路中使用彈性形變對資料進行增強,一方面增加了資料量,另一方面有利於網路對組織形變的適應性。
對於相同類別,臨近物體的分割任務。使用權重損失來解決這個問題,即相同類別之間的背景獲得較大的權重。
網路結構:a contracting path(left side)和an expansive path(right side),兩個部分都是卷積網路。每層中包括兩個3*3的卷積層(unpadding convolution),外加一個ReLU 和一個2*2的max pooling(stride 2),每個下采樣階段使通道數加倍。在擴充套件層中,使用2*2的上採用層,將通道數量減半。並且由於左邊壓縮部分與右邊擴充套件部分的feature map的維度不一樣,所以需要需要裁減左邊的feature map以便能夠進行concat操作。每一層最後加一個ReLU,最後使用1*1的conv進行通道融合。(At the final layer a 1*1 convolution is usedto map each 64-component feature vector to the desired number of classes.)