卷積神經網路應用之影象分割

阿新 • • 發佈：2019-02-05

FNC

FNC主要做的是基於畫素的影象分割預測。其做法是先按照傳統的CNN結構得到feature map，將傳統的全連線層替換成相應的卷積層。如最後一層特徵圖尺寸為 $5 * 5 * 512$ ，對應的全連線層的尺寸為4096，則需要 $5 * 5 * 512 * 4096$ 個引數，將該引數變成卷積核，kernel size 為5*5，input channels 為512， output channels 為4096，依此將傳統的帶有卷積層和全連線層的網路變成全連線神經網路。

FNC的一個好處是它的輸入可以是任意大小的。傳統的CNN結構是在最後一個特徵圖的全連線層是需要固定大小的，比如上面的 $5 * 5 * 512 * 4096$

5 * 5 * 512 * 4096

這裡就確定了最後的特徵圖尺寸是

5 * 5 * 512

。傳統網路如果想要任意輸入，就需要用一個類似SPP(Spatial Pyramid Pooling)的結構。該結構的大概過程就是通過不同層級（大小）的網格劃分圖片，在每個網格中做Pooling操作，再將每個網格得出來的值疊起來得到一個固定長度的向量，進入我們的全連線層。

SPP的工作流程圖大概如上，該例圖將圖片分成3層，第一層用

4 * 4

的網格劃分，第二層用

2 * 2

的網格劃分，第三層把整個圖片分為1塊。則共有

16 + 4 + 1 = 21

個網格塊，通過對每個網格塊進行Pooling操作可以得到21個輸出可以用於全連線層。我們可以通過增加層級，以及改變每層的網格數得到不一樣的input channels。

U-Net

該網路初始用於醫療影象領域，目的是獲得影象的邊緣。
圖中，藍色代表卷積和啟用函式，灰色代表複製，紅色代表下采樣，綠色代表上取樣。

卷積神經網路應用之影象分割

FNC

U-Net

Autoencoder

卷積神經網路應用之影象分割

卷積神經網路及其在影象處理中的應用

用keras小試CNN卷積神經網路應用於人臉識別

CNN卷積神經網路應用於人臉識別（詳細流程+程式碼實現)和相應的超引數解釋

卷積神經網路系列之softmax loss對輸入的求導推導

卷積神經網路系列之softmax，softmax loss和cross entropy loss的講解

day-16 CNN卷積神經網路演算法之Max pooling池化操作學習

編寫C語言版本的卷積神經網路CNN之二：CNN網路的總體結構

卷積神經網路系列之softmax，softmax loss和cross entropy的講解

基於卷積神經網路特徵圖的二值影象分割

全卷積神經網路影象分割(U-net)-keras實現

卷積神經網路的基礎知識及應用——識別、檢測、分割

影象語義分割(1)-FCN:用於語義分割的全卷積神經網路

深度學習框架--深度卷積神經網路CNNs的多GPU並行框架及其在影象識別的應用

卷積神經網路之手寫數字識別應用MNISTCNN

【TensorFlow】第三課卷積神經網路與影象應用

使用全卷積神經網路FCN，進行影象語義分割詳解(附程式碼實現)

卷積神經網路（CNN）在語音識別中的應用

學習筆記之——基於pytorch的卷積神經網路

卷積神經網路之早期架構

卷積神經網路應用之影象分割

FNC

U-Net

Autoencoder

相關推薦