1. 程式人生 > >fcn語義分割 論文

fcn語義分割 論文

全卷積網路:

個人認為本文主要是兩個重點:

第一是fcn,全卷積網路(+上取樣)

第二是skip net

首先說全卷積網路:

通常cnn在卷積層後會接上若干全連線層,但是全連線層和卷積層的連線數量是固定的,這也就導致了輸入必須是固定的尺寸。如下圖所示:

clipboard

但是在fcn中將fc用卷積取代,再加上取樣層,這樣能夠輸入任何大小的圖片,同時輸出圖片相應大小的語義分割。如下圖所示:

clipboard

可以看到兩站圖中的紅色部分略有不同,這是因為第一幅圖中通過全連線層,已經破壞了卷積層輸出feature map的空間結構,而第二幅圖中通過全卷積網路保持了feature map空間結構,在通過反捲積完全可以恢復原影象中目標的空間位置,也成為heat map。從下圖中可以看出heat map中的標記與原圖中cat的位置相似。

clipboard

那作者是如何將fc層替換為全連線層呢?這就樣引出卷積層和全連線層可以相互轉化的關係了。

卷積--------》全連線 :全連線矩陣是一個非常巨大的矩陣,很明顯,全連線層的連線數量要遠遠多於卷積層,所以就可以通過將某些連線置0,使其模擬卷積。

全連線-------》卷積:例如將100x100x1的feature map通過全連線輸出1000大小的一維向量,就可以將每一個輸出看做一個卷積的結果,而卷積的核大小為100x100。

將fc都用conv替換後,接下來就是上取樣(很多部落格稱為反捲積,但是為了區別視覺化中的反捲積還是稱為上取樣了好了)。引用一張cs231n中的ppt,

clipboard

通過輸入設定卷積的權重,然後在輸出中相加。類似於插值的思想。(ps:既然如此那能夠使用反捲積網路搭建一個可學習的插值器,理論上這比採用人工設計的插值要好很多,不知道現在有沒有人做)。

當然整個卷積網路是可以使用反向傳播的。

其次是skip net:

雖然作者在文中也並不是那麼重點地講,但是這種思想還是可以學習的。如下圖:

clipboard

在卷積網路(包括卷積、池化)中,層數越深,感受野越大,學習到的特徵就越概括,作者稱之為coarse(粗糙)。fcn-32s從pooling5上取樣,而結果也顯示細節處理很不好。如下圖:

clipboard

作者通過將低層和高層進行連線,最終可以將低層的影象細節加到粗糙的輪廓中,如上圖。具體怎樣連線的可以看圖。

當見過skip net這種結構的時候,再見到下圖的結構也就不懵逼了。

clipboard

相關推薦

fcn語義分割 論文

全卷積網路: 個人認為本文主要是兩個重點: 第一是fcn,全卷積網路(+上取樣) 第二是skip net 首先說全卷積網路: 通常cnn在卷積層後會接上若干全連線層,但是全連線層和卷積層的連線數量是固定的,這也就導致了輸入必須是固定的尺寸。如下圖所示: 但

語義分割論文閱讀

之前看了一些介紹語義分割的論文,但是沒有記筆記,因為想把時間花在跑模型,增強工程能力上。現在參照別人的文章,把看過的幾篇論文做一個簡單的總結。 1. FCN 網路結構如下圖,即輸入圖片通過CNN網路提取特徵,之後經過上取樣,將特徵恢復成原圖大小,從而達到畫素級別的分割:   全卷積網路,

FCN語義分割初探——使用訓練好的模型進行分割

前言 由於課題的需要,最近開始研究FCN語義分割,這幾天將環境搭建好了立即測試了一下,這裡分享出來與大家進行分享。 1. 準備 1.1 執行環境 這裡使用到的環境是Ubuntu下PyCaffe,具體的環境搭建大家可以參考我的這篇部落格進行環境搭架

FCN語義分割訓練資料(以siftflow和voc2012資料集為例)

截至目前,現已經跑通了siftflow-fcn32s,voc-fcn32s,並製作好了自己的資料集,現在就等大批資料的到來,進而針對資料進行引數fine-tuning,現對我訓練的訓練流程和訓練過程中遇到的問題,做出總結和記錄,從而對以後的學習作鋪墊。 通過這篇分析語義分割

FCN語義分割——直接載入影象資料

前言 在之前的一篇部落格中我們使用了在Github上的程式碼進行語義分割,在進行訓練的時候Github上給出的是mat檔案型別的影象資料,這就很不方便了。這裡經過查閱相關資料之後發現不需要進行格式的轉換也可以進行訓練的。 修改過程 這裡還是用之前的部落

MATCONVNET進行FCN語義分割

CN語義分割演算法已經在很多主流深度學習平臺上實現了,包括Caffe、TenserFlow、MatConvNet等。這篇部落格主要介紹如何在MatConvNet上執行起FCN語義分割,包括CPU和GPU版本。博主的平臺是Matlab2017a+Cuda8.0。下載中心FCN-

FCN語義分割——訓練自己的資料

前言 前段時間研究了下FCN的語義分割,並且將其成功運用在了自己的資料集上,現在分割出來的結果不是很滿意,期待後期的除錯將其提升。這裡就將這個過程記錄下來,希望對各位看官有所幫助 1. 資料集處理 在VOC2012的那個資料集中包含了做好的分割資料集,

Recorder︱影象語義分割FCN、CRF、MRF)、論文延伸(Pixel Objectness、)

影象語義分割的意思就是機器自動分割並識別出影象中的內容,我的理解是摳圖… 之前在Faster R-CNN中借用了RPN(region proposal network)選擇候選框,但是僅僅是候選框,那麼我想提取候選框裡面的內容,就是影象語義分割了。

R-CNN論文翻譯:豐富的功能層次結構,用於精確的物件檢測和語義分割

R-CNN論文地址:R-CNN R-CNN專案地址:  http://www.rossgirshick.info/ 摘要 在典型的PASCAL VOC資料集上測量的物件檢測效能在過去幾年中已經穩定下來。最好的方法是複雜的系統,通常將多個低階影象特徵與高階語境相結合。在本文中,我們

影象語義分割文章彙總(附論文連結和公開程式碼)

吶,我也是做影象分割的啦,最近看到有大佬整理了影象分割方面最新的論文,覺得很有幫助,就轉載過來了,感覺又有很多要學的內容了。   Semantic Segmentation Adaptive Affinity Field for Sem

[深度學習]Semantic Segmentation語義分割FCN(1)

論文全稱:《Fully Convolutional Networks for Semantic Segmentation》 論文地址:https://arxiv.org/pdf/1411.4038.pdf 論文程式碼: python caffe版本 https://github

語義分割FCN個人總結

一、網路結構 FCN涉及到了不同尺度的feature map的融合。 融合理由是:低層特徵具有較多的的解析度資訊,更加精細,但語義資訊較弱。高層特徵具有較多語義資訊,然而較粗糙,解析度資訊不足。為了融合語義資訊和細節資訊,對高層的feature map進行反

深度學習 --- CNN的變體在影象分類、影象檢測、目標跟蹤、語義分割和例項分割的簡介(附論文連結)

以上就是卷積神經網路的最基礎的知識了,下面我們一起來看看CNN都是用在何處並且如何使用,以及使用原理,本人還沒深入研究他們,等把基礎知識總結完以後開始深入研究這幾個方面,然後整理在寫成部落格,最近的安排是後面把自然語言處理總結一下,強化學習的總結就先往後推一下。再往後是系統的學習一下演算法和資料

經典語義分割神經網路-----FCN

The natural next step in the progression from coarse to fine inference is to make a prediction at every pixel. In-network upsampli

目標檢測定位與分割論文閱讀心得總結:FCN U-Net R-CNN FR-CNN Faster R-CNN Mask R-CNN

   目前,基於區域的方法主要分為兩類:任務解耦和的RCNN[1]和任務高度耦合的FCN[2]。 RCNN是將任務分解,目標檢測、定位與分割依次逐一進行,前者決定後者的輸入,因此稱為任務解耦和。而

影象語義分割FCN和CRF

前言 (嘔血製作啊!)前幾天剛好做了個影象語義分割的彙報,把最近看的論文和一些想法講了一下。所以今天就把它總結成文章啦,方便大家一起討論討論。本文只是展示了一些比較經典和自己覺得比較不錯的結構,畢竟這方面還是有挺多的結構方法了。 介紹 影象語義分

最簡單的基於FCN語義分割任務

先上一個圖,這個圖展示的是在Weizmann horse 資料集上做的一個語義分割任務時最簡單的全卷積網路結構。其實寫這個部落格是想記錄一下自己前段時間研究FCN的內容,主要工作是在兩個資料集,一個是Weizmann horse 資料集,另一個是lfw資料集。同樣是使用的FCN網路(層數不同

語義分割經典論文:DeepLab

Here we go 本文所提到的是DeepLabv2: DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully C

[深度學習] FCN 全卷積網路 語義分割

FCN 全卷積網路 Fully Convolutional Networks for Semantic Segmentation 今天實驗室停電,無聊把原來的一個分享PPT發上來 語義分割 語義分割是計算機視覺中的基本任務,也是計算機視覺的熱點,在語義分割中我們