1. 程式人生 > >SegNet-論文筆記-理解

SegNet-論文筆記-理解

核心技術:
總體結構:
這裡寫圖片描述
感覺其實和FCN思路十分相似,只是Encoder,Decoder(Upsampling)使用的技術不一致.此外SegNet的編碼器部分使用的是VGG16的前13層卷積網路,每個編碼器層都對應一個解碼器層,最終解碼器的輸出被送入soft-max分類器以獨立的為每個畫素產生類概率.
每個編碼器由數個藍色層(卷積層,批歸一化層,RELU層)以及一個Pooling層(2x2視窗,步進2,最大池化)組成,輸出相當於係數為2的下采樣.由於最大池化和子取樣的疊加,導致邊界細節損失增大,因此必須在編碼特徵圖中在sub-sampling之前捕獲和儲存邊界資訊.為了高效,文中只儲存了max-pooling indices.

突出貢獻:
分割的精度略好於FCN,總體效率也比FCN略高,