影象語義分割(6)-RefineNet:用於高解析度影象語義分割的帶有恆等對映的多路精細網路

阿新 • • 發佈：2019-01-14

論文地址：RefineNet: Multi-Path Refinement Networks with Identity Mappings for High-
Resolution Semantic Segmentation
論文程式碼：github連結

1. 問題提出

使用深度卷積神經網路進行影象語義分割都會遇到這樣的問題：pooling和卷積步長導致feature map尺寸降低，損失了精細特徵，針對這個問題很多論文提出瞭解決方案：

pooling下采樣導致解析度的損失，採用DeConv反捲積方式很難恢復位置資訊；
使用空洞卷積增大感受野，，但是這樣有兩個缺點：(1)增加了計算代價；(2)空洞卷積本質是一個粗糙的Sub-Sampling，損失了重要的資訊[是不是一個改進的點，還是已經得到了改進？]；

skip-connections產生高解析度的預測，這也是本文作者借鑑的點；

2. 提出方案

提出多路RefineNet，利用多個層級的特徵，使得語義分割更加精確
利用Residual Connections(恆等對映)，使得梯度更加容易長/短傳，使端到端的訓練更加高效
提出chained residual pooling，可以從較大的區域捕捉北京的上下文資訊

3. 基本架構

RefineNet架構靈活，和FCN一樣可以有多種變形：

3.1 Single RefineNet

在這裡插入圖片描述

3.1 2-cascaded RefineNet

在這裡插入圖片描述

3.1 4-cascaded RefineNet

在這裡插入圖片描述

3.1 4-cascaded 2-scale RefineNet

在這裡插入圖片描述

4. 架構解讀

從上一節可以看到，模型的基本結構是RefineNet Block，詳細結構如下：
在這裡插入圖片描述

4.1 RCU：Residual Convolution Unit

這一部分主要用於微調預訓練好的ResNet來適應我們自己的任務，是原始ResNet的一個卷積單元的卷積版本，如3.3中的圖片，RefineNet-4的filters數量是512，其餘三個都是256。

4.2 Multi-Resolution Fusion

這一部分中，實現對輸入進行卷積以產生相同維度的特徵圖，然後把所有特徵圖上取樣至最大的輸入的尺寸，最後將所有特徵圖fused by summation。如果只有一個輸入路徑(3.3中的RefineNet-4),那麼這個輸入可以跳過這個模組，也就是go through without changes。

4.3 Chained Residual Pooling

這個模組主要用於較大影象區域中捕獲背景的上下文資訊。

4.4 Output Convolutions

這個部分由三個RCU串聯而成，主要將非線性操作應用到多路融合的特徵圖從而產生用於分類的特徵圖，通過這個部分特徵圖維度不變。

4.5 Idebtity Mappings for end2end trainging

5. 實驗結果

在這裡插入圖片描述

影象語義分割(6)-RefineNet:用於高解析度影象語義分割的帶有恆等對映的多路精細網路

論文地址：RefineNet: Multi-Path Refinement Networks with Identity Mappings for High- Resolution Semantic Segmentation 論文程式碼：github連結 1. 問題提出使

DeepZoom互動方式檢視高解析度影象技術知識點

1，Deep Zoom Deep Zoom 提供以互動方式檢視高解析度影象的能力。您可以快速放大和縮小影象，而不會影響應用程式的效能。Deep Zoom 允許通過提供多分辯率影象和使用彈簧動畫來使載入和平移變平滑。 2，dzi檔案是什麼型別檔案？

減少OpenCV讀取高解析度影象的時間

意義目前無論是工業上還是生活中相機的解析度也會越來越高，無論是學術上還是工業上使用OpenCV進行影象處理，特別是大批量處理的時候，讀取一張高解析度影象到記憶體中的時間減少的話對大批量的影象處理的效率有大大的幫助，特別現在全景圖越來越普遍，好了，廢話不少說。

影象語義分割(11)-BiSeNet:用於實時語義分割的雙向分割網路

論文地址：BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation 1. 摘要語義分割任務不僅需要豐富的空間位置資訊，還需要尺寸客觀的感受野，但是現有的方法為了提速往往採取損失空

影象語義分割(10)-DeepLabV3+: 用於影象語義分割的帶有空洞可分離卷積的編解碼結構

論文地址：Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation 論文程式碼：Github連結 1. 摘要文章主要的工作是將空間金字塔池化和編解碼模組結合，在Dee

影象語義分割(1)-FCN:用於語義分割的全卷積神經網路

論文地址：Fully Convolutional Networks for Semantic Segmentation [Long J , Shelhamer E , Darrell T . Fully Convolutional Networks for Semantic Segmen

Matlab匯出高DPI影象——生成高解析度.eps .tiff .jpg

Matlab高解析度DPI匯出eps、tiff論文用圖論文中常常要求高dpi的影象匯出，matlab fig中的export設定可以幫助我們實現這樣的目標。 1.使用file>export setup matlab 繪圖完成後我們通常會的得到下面這樣的f

一文詳解計算機視覺五大技術：影象分類、物件檢測、目標跟蹤、語義分割和例項分割

【導讀】目前，計算機視覺是深度學習領域最熱門的研究領域之一。計算機視覺實際上是一個跨領域的交叉學科，包括電腦科學（圖形、演算法、理論、系統、體系結構），數學（資訊檢索、機器學習），工程學（機器人、語音、自然語言處理、影象處理），物理學（光學），生物學（神經科學）和心理學（認知科學）等等。許

詳解計算機視覺五大技術：影象分類、物件檢測、目標跟蹤、語義分割和例項分割...

語義分割：使用關係圖輔助影象分割-Capsule Network、IceNet

文章：在SceneParsing上準確率暫時得到第一的IceNet https://hszhao.github.io/projects/icnet/ 文章：https://arxiv.org/pdf/1704.08545.pdf 優化方

U-Net：用於生物醫學影象分割的卷積網路

轉自：http://baijiahao.baidu.com/s?id=1600400677130320639&wfr=spider&for=pc摘要眾所周知，成功地訓練一個深度網路需要大量的已標註資料集。本文提出了一種新的網路結構和訓練方法，依靠資料增強將有效

css總結6：行高和字體大小的關系

屬性大小分享 spa bubuko 行高 ron col OS 1 CSS line-height 屬性代碼： p.small {line-height:70%}p.big {line-height:200%} 運行後：70%與200%寬高 2 CSS f

Confluence 6 布局高級自定義

Confluence重載 Velocity 模板velocity 目錄是 Confluence Velocity 模板文件進行搜索時候需要的文件夾。例如，你可以通過將你的 Velocity 文件使用正確的文件名放置到正確的路徑。我們不建議對你的 Confluence 站點進行這樣的操作，除非你明確知道你在進行

影象標註工具彙總目標檢測標註工具影象分割標註工具

對於監督學習演算法而言，資料決定了任務的上限，而演算法只是在不斷逼近這個上限。世界上最遙遠的距離就是我們用同一個模型，但是卻有不同的任務。但是資料標註是個耗時耗力的工作，下面介紹幾個影象標註工具： Labelme Labelme適用於影象分割任務的資料集製作：它來自下面的專案：https:

[python3.6+opencv] 02 imwrite-開啟影象後儲存退出還是不儲存退出的問題

載入一個灰度圖，顯示圖片，按下’s’鍵儲存後退出，或者按下 ESC 鍵退出不儲存 1 # -*- coding: utf-8 -*- 2 3 import numpy as np 4 import cv2 as cv 5 6 img = cv.imread("C:/Users/w

[ERROR] 不再支援源選項 1.5。請使用 1.6 或更高版本。 [ERROR] 不再支援目標選項 1.5。請使用 1.6 或更高版本。解決方法！！

今天在maven中編譯時出現如下資訊 [INFO] ------------------------------------------------------------- [ERROR] COMPILATION ERROR : [INFO] -------------------

影象處理（十一）影象分割(3)泛函能量LevelSet、snake分割

一、level set相關理論基於水平集的影象分割演算法是一種進化版的Snake演算法，也是需要給定初始的輪廓曲線，然後根據泛函能量最小化，進行曲線演化。水平集的方法，用的是一種隱式函式的方法，這個演算法比較難理解，我一年前開始搞這個演算法的時候，雖然知道程式碼怎麼寫，但是它的原理推

【電腦科學】【2017.11】【含原始碼】用於超光譜影象畫素分類的深度學習研究

本文為荷蘭代爾夫特理工大學（作者：I.A.F. Snuverink）的碩士論文，共128頁。在超光譜（HS）成像中，每一個畫素都要捕獲波長光譜，這些光譜代表材料性質，即光譜特徵。因此，HS影象的分類是基於材料屬性的。本文介紹了一種在不同環境條件下的固定場景中進行HS影象畫素分類的

Mac執行mvn compile報錯“ 不再支援源選項 1.5。請使用 1.6 或更高版本”

報錯截圖：解決方式：在pox.xml檔案里加上下面的程式碼： <properties> <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>

基於BiLinear的VGG16+ResNet50，用於細粒度影象分類

細粒度視覺識別之雙線性CNN模型 [1] Lin T Y, RoyChowdhury A, Maji S. Bilinear cnn models for fine-grained visual recognition[C]//Proceedings of the IEEE

影象語義分割(6)-RefineNet:用於高解析度影象語義分割的帶有恆等對映的多路精細網路

1. 問題提出

2. 提出方案

3. 基本架構

3.1 Single RefineNet

3.1 2-cascaded RefineNet

3.1 4-cascaded RefineNet

3.1 4-cascaded 2-scale RefineNet

4. 架構解讀

4.1 RCU：Residual Convolution Unit

4.2 Multi-Resolution Fusion

4.3 Chained Residual Pooling

4.4 Output Convolutions

4.5 Idebtity Mappings for end2end trainging

5. 實驗結果

相關推薦