[深度學習從入門到女裝]FCN

阿新 • • 發佈：2018-12-19

本文簡單介紹一下FCN模型，並對caffe原始碼進行閱讀

對於convolution:

output = (input + 2 * padding - ksize) / stride + 1;

對於deconvolution:

output = (input - 1) * stride + ksize - 2 * padding;

fcn8s程式碼：

layer { name: "input" type: "Input" top: "data" input_param { # These dimensions are purely for sake of example; # see infer.py for how to reshape the net to the given input size. shape { dim: 1 dim: 3 dim: 500 dim: 500 } } }

輸入為500*500*3

layer { name: "conv1_1" type: "Convolution" bottom: "data" top: "conv1_1" param { lr_mult: 1 decay_mult: 1 } param { lr_mult: 2 decay_mult: 0 } convolution_param { num_output: 64 pad: 100 kernel_size: 3 stride: 1 } } layer { name: "relu1_1" type: "ReLU" bottom: "conv1_1" top: "conv1_1" }

第一個卷積層conv1_1的pad為100 pad後為700*700*3

使用64個3*3*3進行卷積操作後輸出為698*698*64

layer { name: "conv1_2" type: "Convolution" bottom: "conv1_1" top: "conv1_2" param { lr_mult: 1 decay_mult: 1 } param { lr_mult: 2 decay_mult: 0 } convolution_param { num_output: 64 pad: 1 kernel_size: 3 stride: 1 } } layer { name: "relu1_2" type: "ReLU" bottom: "conv1_2" top: "conv1_2" }

第二個卷積層conv1_2的pad為1 pad後為700*700*64

使用64個3*3*64進行卷積操作後輸出為698*698*64

layer { name: "pool1" type: "Pooling" bottom: "conv1_2" top: "pool1" pooling_param { pool: MAX kernel_size: 2 stride: 2 } }

使用stride為2的MAXpool進行pooling後輸出為349*349*64

conv2_1：num_output: 128 pad: 1 kernel_size: 3 stride: 1

輸出為349*349*128

conv2_2：num_output: 128 pad: 1 kernel_size: 3 stride: 1

輸出為349*349*128

pool2：MAXpooling stride2 size2 輸出為175*175*128（pool使用向上取整）

conv3_1、conv3_2、conv3_3：num_output: 256 pad: 1 kernel_size: 3 stride: 1

輸出為175*175*256

pool3：MAXpooling stride2 size2 輸出為88*88*256（pool使用向上取整）

conv4_1、conv4_2、conv4_3：num_output: 512 pad: 1 kernel_size: 3 stride: 1

輸出為88*88*512

pool4：MAXpooling stride2 size2 輸出為44*44*512（pool使用向上取整）

conv5_1、conv5_2、conv5_3：num_output: 512 pad: 1 kernel_size: 3 stride: 1

輸出為44*44*512

pool5：MAXpooling stride2 size2 輸出為22*22*512（pool使用向上取整）

layer { name: "fc6" type: "Convolution" bottom: "pool5" top: "fc6" param { lr_mult: 1 decay_mult: 1 } param { lr_mult: 2 decay_mult: 0 } convolution_param { num_output: 4096 pad: 0 kernel_size: 7 stride: 1 } } layer { name: "relu6" type: "ReLU" bottom: "fc6" top: "fc6" }

（這個作者真的懶，改的VGG16的框架，連全連線層的名字都沒給改成卷積層。。。）

輸入為 22*22*512 輸出為16*16*4096

layer { name: "fc7" type: "Convolution" bottom: "fc6" top: "fc7" param { lr_mult: 1 decay_mult: 1 } param { lr_mult: 2 decay_mult: 0 } convolution_param { num_output: 4096 pad: 0 kernel_size: 1 stride: 1 } } layer { name: "relu7" type: "ReLU" bottom: "fc7" top: "fc7" }

輸入為16*16*4096 輸出為16*16*4096

layer { name: "score_fr" type: "Convolution" bottom: "fc7" top: "score_fr" param { lr_mult: 1 decay_mult: 1 } param { lr_mult: 2 decay_mult: 0 } convolution_param { num_output: 21 pad: 0 kernel_size: 1 } }

score_fr：輸入為16*16*4096 輸出為16*16*21

layer { name: "upscore2" type: "Deconvolution" bottom: "score_fr" top: "upscore2" param { lr_mult: 0 } convolution_param { num_output: 21 bias_term: false kernel_size: 4 stride: 2 } }

upscore2：輸入為16*16*21 輸入為34*34*21

layer { name: "score_pool4" type: "Convolution" bottom: "pool4" top: "score_pool4" param { lr_mult: 1 decay_mult: 1 } param { lr_mult: 2 decay_mult: 0 } convolution_param { num_output: 21 pad: 0 kernel_size: 1 } }

score_pool4：輸入為44*44*512 輸出為44*44*21

layer { name: "score_pool4c" type: "Crop" bottom: "score_pool4" bottom: "upscore2" top: "score_pool4c" crop_param { axis: 2 offset: 5 } }

score_pool4c：這一層為對socre_pool4進行裁剪 caffe中crop作用詳見Caffe中crop_layer層的理解和使用

輸入為44*44*21 輸出為34*34*21

layer { name: "fuse_pool4" type: "Eltwise" bottom: "upscore2" bottom: "score_pool4c" top: "fuse_pool4" eltwise_param { operation: SUM } }

fuse_pool4：這一層是為了將upscore2與score_pool4c進行合併，進行不同層次特徵融合輸入為34*34*21

layer { name: "upscore_pool4" type: "Deconvolution" bottom: "fuse_pool4" top: "upscore_pool4" param { lr_mult: 0 } convolution_param { num_output: 21 bias_term: false kernel_size: 4 stride: 2 } }

upscore_pool4：輸入為34*34*21 輸出為70*70*21

layer { name: "score_pool3" type: "Convolution" bottom: "pool3" top: "score_pool3" param { lr_mult: 1 decay_mult: 1 } param { lr_mult: 2 decay_mult: 0 } convolution_param { num_output: 21 pad: 0 kernel_size: 1 } }

score_pool3：輸入為88*88*256 輸出為88*88*21

layer { name: "score_pool3c" type: "Crop" bottom: "score_pool3" bottom: "upscore_pool4" top: "score_pool3c" crop_param { axis: 2 offset: 9 } }

score_pool3c：這層將score_pool3進行裁剪為和upscore_pool4相同尺寸

輸入為88*88*21 輸出為70*70*21

layer { name: "fuse_pool3" type: "Eltwise" bottom: "upscore_pool4" bottom: "score_pool3c" top: "fuse_pool3" eltwise_param { operation: SUM } }

fuse_pool3：將upscore_pool4和score_pool3c特徵圖融合相加輸出為70*70*21

layer { name: "upscore8" type: "Deconvolution" bottom: "fuse_pool3" top: "upscore8" param { lr_mult: 0 } convolution_param { num_output: 21 bias_term: false kernel_size: 16 stride: 8 } }

upscore8：輸入為70*70*21 輸出為568*568*21

layer { name: "score" type: "Crop" bottom: "upscore8" bottom: "data" top: "score" crop_param { axis: 2 offset: 31 } }

score：對最終分割圖進行裁剪輸出為506*506*21

[深度學習從入門到女裝]FCN

本文簡單介紹一下FCN模型，並對caffe原始碼進行閱讀對於convolution: output = (input + 2 * padding - ksize) / stride + 1; 對於deconvolution: output = (input -

[深度學習從入門到女裝]U-Net

上圖為U-Net的網路結構整個結構很容易理解，下采用使用2*2的maxPooling，上採用使用2*2的deconv 其他的每個卷積都使用3*3不使用padding的卷積核，因此特徵圖會越來越小，每層增加一倍通道數 shortcut將同層的左邊特徵圖直

[深度學習從入門到女裝]3D U-JAPA-Net

這是今年發在MICCAI2018上的一篇腹部多器官分割的論文，使用的是3D u-net的改進版，加入了PA（probabilistic atlas）網路結構和3D U-Net的結構完全相同，但是訓練分為了幾個步驟 1、使用所有器官資料進行這個3D U-Net

Linux學習從入門到打死也不放棄，完全筆記整理（持續更新）

linux 運維學習筆記這是一片學習筆記的匯總，查看內容請點擊各章節介紹。第一章，計算機基礎和linux基本介紹 http://blog.51cto.com/13683480/2095433 第二章，linux基礎 http://blog.51

深度學習如何入門

網上看了很多作為基礎者，如何學習深度學習？下面，對網上的一些資源評論進行一個總結概括，給自己選擇一條好的道路。首先大神推薦的《1天搞懂深度學習》，臺灣李巨集毅教授寫的，據說通俗易懂，系統的介紹和概括了深度學習的入門。深度學習，是根據經驗值，給一個初始值，再根據模型（其實也就是數學公式

python學習從入門到精通要多久？

Python是近幾年來的新秀語言。在程式語言的排行榜上異軍突起。在目前科技的最前沿，人工智慧（AI）領域也佔據了一席之地。於是，追逐潮流的同學們也加入了學習Python的大軍中。python學習從入門到精通要多久？按理說，Python學習什麼時候才能精通，是沒有具體時間的。原因很簡單，每個人的學習能力，每個人

深度學習 --- 優化入門六（正則化、引數範數懲罰L0、L1、L2、Dropout）

前面幾節分別從不同的角度對梯度的優化進行梳理，本節將進行正則化的梳理，所謂正則化，簡單來說就是懲罰函式，在機器學習中的SVM中引入拉格朗日乘子法即引入懲罰項解決了約束問題，在稀疏自編碼器中我們引入了懲罰因子去自動調整隱層的神經元的個數，以此達到壓縮率和失

[深度學習]從全卷積網路到大型卷積核：深度學習的語義分割全指南

語義分割一直是計算機視覺中十分重要的領域，隨著深度學習的流行，語義分割任務也得到了大量的進步。本文首先闡釋何為語義分割，然後再從論文出發概述多種解決方案。本文由淺層模型到深度模型，簡要介紹了語義分割各種技術，雖然本文並沒有深入講解語義分割的具體實現，但本文簡要地概述了每一篇重要

tensorflow學習從入門到實戰(轉)

原文作者：zhaozhengcoder連結：https://www.jianshu.com/p/27a2fb320934來源：簡書簡書著作權歸作者所有，任何形式的轉載都請聯絡作者獲得授權並註明出處。前一段時間比較系統的學習了一下tensorflow，從安裝tensorflow到實

QT學習從入門到入門 step by step (3)

接上文通過上邊的兩種方法，大體瞭解了Qt的類及介面設計器的用法，下邊的方法是把Qt的介面封裝成一個自定義類 3. 通過自定義類生成helloworld （1）還是建立一個空專案（2）新增一個自定義介面（3）建一個c++類，繼承自 QDialog，通過此可學習Q

QT學習從入門到入門 step by step (4)

專案檔案 *.pro 檔案分析 #--------------------------- # 註釋部分 # 注意：本檔案不支援 “//”做註釋，若使用則編譯時報錯 #--------------------------- QT += core gui //在使用qmake

深度學習 --- 優化入門五（Batch Normalization（批量歸一化）二）

批歸一化真的可以解決內部協方差偏移問題？如果不能解決，那它的作用是什麼？你所接受的整個深度學習教育是一個謊言嗎？讓我們來尋找答案吧！開始之前...... 我想提醒一下，本文是深度學習優化算法系列的第四篇，前三篇文章討論了：隨機梯度下降如何克服深度學習中的區域性極小值和鞍點

深度學習 --- 優化入門四（Batch Normalization（批量歸一化）一）

前幾節我們詳細的探討了，梯度下降存在的問題和優化方法，本節將介紹在資料處理方面很重要的優化手段即批量歸一化（批量歸一化）。批量歸一化（Batch Normalization）並不能算作是一種最優化演算法，但其卻是近年來優化深度神經網路最有用的技巧之一，並且這種方法非常的簡潔方便，可以和其他

深度學習 --- 優化入門三（梯度消失和啟用函式ReLU）

前兩篇的優化主要是針對梯度的存在的問題，如鞍點，區域性最優，梯度懸崖這些問題的優化，本節將詳細探討梯度消失問題，梯度消失問題在BP的網路裡詳細的介紹過（興趣有請的檢視我的這篇文章），然後主要精力介紹RuLU啟用函式，本篇還是根據國外的文章進行翻譯，然後再此基礎上補充，這樣使大家更容易理解，好，那

深度學習 --- 優化入門二（SGD、動量(Momentum)、AdaGrad、RMSProp、Adam詳解）

另在一篇文章中，我們介紹了隨機梯度下降的細節以及如何解決陷入區域性最小值或鞍點等問題。在這篇文章中，我們看看另一個困擾神經網路訓練的問題，即病態曲率。雖然區域性最小值和鞍點可以阻止我們的訓練，但是病態曲率可以使訓練減慢到機器學習從業者可能認為搜尋已經收斂到次優極小值的程度。讓我們深入瞭解病

深度學習 --- 優化入門一（梯度下降所面臨的問題）

前面幾節詳細介紹了卷積神經網路和深度卷積神經網路，這個網路可以說是為影象處理量身製作，同時在2010年，hintion帶領的團隊使用AlexNet網路（深度卷積網路）在ImageNet大賽中獲得冠軍，更是奠定了卷積網路的商業地位，到目前為止該網路也是影象識別的主要網路之一。本節開始針對深度網路進

機器學習和深度學習概念入門

作者：譚東遵循：BY-SA（署名-相同方式共享4.0協議）對於很多初入學習人工智慧的學習者來說，對人工智慧、機器學習、深度學習的概念和區別還不是很瞭解，有可能你每天都能聽到這個概念，也經常提這個概念，但是你真的懂它們之間的關係嗎？那麼接下來就給

人工智慧新書推薦——《PyTorch機器學習從入門到實戰》

人工智慧入門實踐，輕鬆玩轉PyTorch框架。校寶線上出品的書籍《PyTorch機器學習從入門到實踐》發售了！內容簡介近年來，基於深度學習的人工智慧掀起了一股學習的熱潮。本書是使用PyTorch深度學習框架的入門書籍。本書從深度學習原理入手，由淺入

[深度學習]從Attention到Transformer到BERT

Jay Alammar用直觀直白的方式解釋了Attention，Transformer和BERT。並輔以很多生動的圖例。 Attention Visualizing A Neural Machine Translation Model (Mechanics of Seq2seq Models

PyTorch 60 分鐘入門教程：PyTorch 深度學習官方入門中文教程

什麼是 PyTorch? PyTorch 是一個基於 Python 的科學計算包，主要定位兩類人群： NumPy 的替代品，可以利用 GPU 的效能進行計算。深度學習研究平臺擁有足夠的靈活性和速度開始學習 Tensors (張量)

[深度學習從入門到女裝]FCN

相關推薦