1. 程式人生 > >U-NET語義分割方法解讀

U-NET語義分割方法解讀

2014年,加州大學伯克利分校的Long等人提出的 全卷積網路(FCN) ,推廣了原有的CNN結構, 在不帶有全連線層的情況下能進行密集預測。 這種結構的提出使得分割圖譜可以生成任意大小的影象,且與影象塊分類方法相比,也提高了處理速度。在後來,幾乎所有關於語義分割的最新研究都採用了這種結構。 除了全連線層結構,在分割問題中很難使用CNN網路的另一個問題是存在池化層。 池化層不僅能增大上層卷積核的感受野,而且能聚合背景同時丟棄部分位置資訊。然而,語義分割方法需對類別圖譜進行精確調整,因此需保留池化層中所捨棄的位置資訊。 研究者提出了兩個不同形式的結構來解決這個問題。
第一種方法是編碼器-解碼器(encoder-decoder)結構。 其中,編碼器使用池化層逐漸縮減輸入資料的空間維度,而解碼器通過反捲積層等網路層逐步恢復目標的細節和相應的空間維度。從編碼器到解碼器之間,通常存在直接的資訊連線,來幫助解碼器更好地恢復目標細節。在這種方法中,一種典型結構為U-Net網路。
第二種方法使用了稱作空洞卷積的結構,且去除了池化層結構。經典的代表就是DeepLab2網路。 未完待續……