深度學習之語義分割-SegNet

阿新 • • 發佈：2019-01-05

This core trainable segmentation engine consists of an encoder network, a corresponding decoder network followed by a pixel-wise classification layer.

模型

說明：
- 基礎模型採用VGG16
  - 去掉fc層，使得encoder網路更小，更易訓練
  - 134M –> 14.7M
- decoder網路將encoder網路中的低層畫素對映到整張影象尺寸
  - decoder網路與encoder網路基本完全對成
  - 最終，對每一個畫素進行multi-class soft-max分類
- decoder網路進行上取樣的採用pool indices
  - 沒有增加引數：稀疏，且不需要參與訓練
  - 降低記憶體：decoder不用儲存encoder中的輸出結果
  - 提升了邊界的描繪能力
  - 該網路結構可以拓展到任意的encoder-decoder網路結構
效果：
注意
- Max-pooling可以提高平移不變形：
  - Max-pooling is used to achieve translation invariance over small spatial shifts in the input image.
- 降取樣是的feature層上的每一個點對應原圖上一塊很大的區域
  - Sub-sampling results in a large input image context (spatial window) for each pixel in the feature map.
- 多次的max-pooling和降取樣雖然能夠提高模型的分類能力，但是缺丟失了影象中的空間邊界能力
  - While several layers of max-pooling and sub-sampling can achieve more translation invariance for robust classification correspondingly there is loss of spatial resolution of the feature maps.
- 特徵層上的空間位置關係對於分割任務非常重要
  - The increasingly lossy (boundary detail) image representation is not beneficial for segmentation where boundary delineation is vital

效果分析

實驗1:

對比不同的decoder模型

說明
- 採用雙線性插值進行上取樣，固定引數【不參與學習】
- 採用max-pooling indices進行上取樣【不參與學習】
- 採用雙線性插值進行上取樣，引數參與學習
  - 雙線性插值進行初始化
- SegNet-Basic採用類似FCN的decoder方式
  - 4個encoder，4個decoder
  - upsample上取樣採用下采樣downsample的indices
  - encoder／decoder上，每一個conv之後接一個BN操作。
  - 對於decoder網路，conv中沒有采用ReLU非線性啟用函式和biases偏置
  - 採用7x7卷積核，則VGG layer4的感受野為106x106
  - decoder卷積的filter個數與對一個的encoder卷積filter個數相同
- SegNet-SingleChannelDecoder
  - decoder卷積核個數位1
- FCN-Basic-NoDimReduction
  - 最終的維度和對應的encoder相對應
- 結論還是FCN-Basic-NoDimReduction的效果最好

總結

該論文提出了一種encoder-decoder的分割方法，相比較FCN，該方法採用了max-pooling indices進行上取樣，有效的降低了upsample中的記憶體使用問題。

參考文獻

深度學習之語義分割-SegNet

This core trainable segmentation engine consists of an encoder network, a corresponding decoder network followed by a pixel-wise

深度學習之---語義分割+視訊分割開原始碼文獻集合

語義分割 Light-Weight RefineNet for Real-Time Semantic Segmentation BMVC 2018 https://github.com/DrSleep/light-weight-refinenet 語義分割 ESPNet: Efficient S

[深度學習]從全卷積網路到大型卷積核：深度學習的語義分割全指南

語義分割一直是計算機視覺中十分重要的領域，隨著深度學習的流行，語義分割任務也得到了大量的進步。本文首先闡釋何為語義分割，然後再從論文出發概述多種解決方案。本文由淺層模型到深度模型，簡要介紹了語義分割各種技術，雖然本文並沒有深入講解語義分割的具體實現，但本文簡要地概述了每一篇重要

[深度學習]圖片語義分割深度學習演算法要點回顧

Review of Deep Learning Algorithms for Image Semantic Segmentation Arthur Ouaknine Dec 11

遷移學習之語義分割對抗域適應

問題背景：自動駕駛場景：當前語義分割演算法需要大量有標籤的資料集，然而，這些畫素級的標註資訊的獲取代價是非常巨大的。針對這一問題，有學者提出了通過遊戲引擎來合成自動駕駛場景下的影象資料，同時得到畫素級的語義標籤，避免了標註真實影象所需要耗費的大量人力物力。 &nbs

當前主流的深度學習影象語義分割模型解析

轉載自【量子位】公眾號 QbitAI原文地址：http://www.sohu.com/a/155907339_610300影象語義分割就是機器自動從影象中分割出物件區域，並識別其中的內容。量子位今天推薦的這篇文章，回顧了深度學習在影象語義分割中的發展歷程。釋出這篇文章的Qur

（譯）從全卷積網路到大型卷積核：深度學習的語義分割全指南

機器之心：By路雪 2017年7月14日什麼是語義分割？　　語義分割指畫素級地識別影象，即標註出影象中每個畫素所屬的物件類別。如下圖：　　　　左：輸入影象，右：該影象的語義分割　　除了識別車和騎車的人，我們還需要描繪出每個物體的邊界。因此，與影象分類

深度學習之圖片語義分割程式碼實現

使用tensorflow和python，vgg基礎上實現FCN8s網路，實現圖片語義分割：資料集：VOC2012/ImageSets/Segmentation中，分為train.txt 1464張圖片和val.txt1449張圖片。 # class classes

深度學習之收斂問題

bat 模擬訓練 gin i-o 都是 wid 分類 number http://blog.csdn.net/xlbryant/article/details/48470987 1.數據庫太小一般不會帶來不收斂的問題，只要你一直在train總會收斂（rp問題跑飛了不算）。

1.深度學習之安裝教程

步驟 install sta tensor lib64 libc 鏈接 lib flow 在centos5下安裝TensorFlow。步驟： 1.安裝python3.5 2.安裝pip3，同時建立軟鏈接。 3.安裝TensorFlow，pip install --upgr

深度學習之tensorflow （一）

spa 計算 put range mst reduce logs 分析 pen 一、TensorFlow簡介 1.TensorFlow定義： tensor ：張量，N維數組 Flow : 流，基於數據流圖的計算 TensorFlow : 張量從圖像

深度學習之 seq2seq 進行英文到法文的翻譯

enc super load mark ext pre res drop zeros 深度學習之 seq2seq 進行英文到法文的翻譯 import os import torch import random source_path = "data/small

深度學習之圖片壓縮算法

深度學習、圖片壓縮近年來，深度學習在計算機視覺領域已經占據主導地位，不論是在圖像識別還是超分辨重現上，深度學習已成為圖片研究的重要技術；現在深度學習技術已進入圖片壓縮領域。以圖鴨科技最新研發的圖片壓縮——Tiny Network Graphics (TNG) 為例，其以深度學習卷積神經網絡為內核，在保持相同圖

Tensorflow深度學習之十二：基礎圖像處理之二

fcm 數字 ssi port con tty .net term file Tensorflow深度學習之十二：基礎圖像處理之二 from：https://blog.csdn.net/davincil/article/details/76598474 首先放出

深度學習之 GRU 算法例子

深度學習 GRU 算法例子首先下載代碼：https://github.com/whk6688/rnn 例子1：預測下文 private void train(CharText ctext, double lr) { Map<Integer, String> indexChar

深度學習之 TensorFlow（四）：卷積神經網絡

padding valid 叠代 val 分析此外 nbsp drop BE 基礎概念：　　卷積神經網絡（CNN）：屬於人工神經網絡的一種，它的權值共享的網絡結構顯著降低了模型的復雜度，減少了權值的數量。卷積神經網絡不像傳統的識別算法一樣，需要對數據進行特征提取和數據重

深度學習之 DeepLearning4j 預測股市走向

深度學習之 DeepLearning4上一篇，預測花的類型，是沒有用到中間件的，實際情況是，數據量是非常大的，所以不實用，這次使用DeepLearning4j來預測股市走向，後續加上spark。代碼如下： public class DailyData { //開盤價 private doub

機器學習&深度學習之路

線性概率論向量正則決策下機正則化希望池化計劃最近好好按步驟按階段系統性的學習下機器學習和深度學習，希望能堅持下去。基礎數學篇 [高等數學：求導、梯度] [高等數學：泰勒展開] [概率論：基本概念、條件概率、全概率、樸素貝葉斯] [概率論：期望、方差

深度學習之神經網絡（CNN/RNN/GAN）算法原理+實戰

依次正向重要深入 tun 機器學習算法及其卷積 -m 第1章課程介紹深度學習的導學課程，主要介紹了深度學習的應用範疇、人才需求情況和主要算法。對課程章節、課程安排、適用人群、前提條件以及學習完成後達到的程度進行了介紹，讓同學們對本課程有基本的認識。第2章

深度學習圖像分割——U-net網絡

之間 https 實際應用度量 amp 很多增加黃色填充寫在前面：一直沒有整理的習慣，導致很多東西會有所遺忘，遺漏。借著這個機會，養成一個習慣。對現有東西做一個整理、記錄，對新事物去探索、分享。因此博客主要內容為我做過的，所學的整理記錄以及新的算法、網絡框架

深度學習之語義分割-SegNet

模型

效果分析

實驗1:

總結

參考文獻

相關推薦