《2017-Dual Path Networks》論文解讀

阿新 • • 發佈：2018-11-24

解讀Dual Path Networks（DPN，原創）

動機

以前方法的不足
- ResNet：側重於特徵的再利用，但不善於發掘新的特徵；
- DenseNet: 側重於新特徵的發掘，但又會產生很多冗餘；

優點

關於模型複雜度，作者的原文是這麼說的：The DPN-92 costs about 15% fewer parameters than ResNeXt-101 (32 4d), while the DPN-98 costs about 26% fewer parameters than ResNeXt-101 (64 4d).
關於計算複雜度，作者的原文是這麼說的：DPN-92 consumes about 19% less FLOPs than ResNeXt-101(32 4d), and the DPN-98 consumes about 25% less FLOPs than ResNeXt-101(64 4d).

方法

ResNet和DenseNet是近幾年兩種比較熱門的網路結構，ResNet把輸入直接加到（element-wise adding）卷積的輸出上，DenseNet則把每一層的輸出都拼接（concatenate）到了其後每一層的輸入上。在這篇論文中作者用High Order RNN結構（HORNN）把DenseNet和ResNet聯絡到了一起，證明了DenseNet能從靠前的層級中提取到新的特徵，而ResNet本質上是對之前層級中已提取特徵的複用。
為了綜合二者的優點，作者設計了DPN網路，其數學形式如下

顯然，式(5)表示DenseNet的形式，側重於發掘新特徵；式(6)表示ResNet的形式，側重於特徵的再利用；式（7）表示二者結合。

網路結構

這裡寫圖片描述

因為DPN演算法簡單講就是將ResNeXt和DenseNet融合成一個網路，因此在介紹DPN的每個stage裡面的結構之前，先簡單過一下ResNet（ResNeXt和ResNet的子結構在巨集觀上是一樣的）和DenseNet的核心內容。下圖中的（a）是ResNet的某個stage中的一部分。（a）的左邊豎著的大矩形框表示輸入輸出內容，對一個輸入x，分兩條線走，一條線還是x本身，另一條線是x經過1x1卷積，3x3卷積，1x1卷積（這三個卷積層的組合又稱作bottleneck），然後把這兩條線的輸出做一個element-wise addition，也就是對應值相加，就是（a）中的加號，得到的結果又變成下一個同樣模組的輸入，幾個這樣的模組組合在一起就成了一個stage（比如Table1中的conv3）。（b）表示DenseNet的核心內容。（b）的左邊豎著的多邊形框表示輸入輸出內容，對輸入x，只走一條線，那就是經過幾層卷積後和x做一個通道的合併（cancat），得到的結果又成了下一個小模組的輸入，這樣每一個小模組的輸入都在不斷累加，舉個例子：第二個小模組的輸入包含第一個小模組的輸出和第一個小模組的輸入，以此類推。

這裡寫圖片描述

DPN是怎麼做呢？簡單講就是將Residual Network 和 Densely Connected Network融合在一起。下圖中的（d）和（e）是一個意思，所以就按（e）來講吧。（e）中豎著的矩形框和多邊形框的含義和前面一樣。具體在程式碼中，對於一個輸入x（分兩種情況：一種是如果x是整個網路第一個卷積層的輸出或者某個stage的輸出，會對x做一個卷積，然後做slice，也就是將輸出按照channel分成兩部分：data_o1和data_o2，可以理解為（e）中豎著的矩形框和多邊形框；另一種是在stage內部的某個sub-stage的輸出，輸出本身就包含兩部分：data_o1和data_o2），走兩條線，一條線是保持data_o1和data_o2本身，和ResNet類似；另一條線是對x做1x1卷積，3x3卷積，1x1卷積，然後再做slice得到兩部分c1和c2，最後c1和data_o1做相加（element-wise addition）得到sum，類似ResNet中的操作；c2和data_o2做通道合併（concat）得到dense（這樣下一層就可以得到這一層的輸出和這一層的輸入），也就是最後返回兩個值：sum和dense。以上這個過程就是DPN中一個stage中的一個sub-stage。有兩個細節，一個是3*3的卷積採用的是group操作，類似ResNeXt，另一個是在每個sub-stage的首尾都會對dense部分做一個通道的加寬操作。

這裡寫圖片描述

實驗結果：

Table2是在ImageNet-1k資料集上和目前最好的幾個演算法的對比：ResNet，ResNeXt，DenseNet。可以看出在模型大小，GFLOP和準確率方面DPN網路都更勝一籌。不過在這個對比中好像DenseNet的表現不如DenseNet那篇論文介紹的那麼喜人，可能是因為DenseNet的需要更多的訓練技巧。

這裡寫圖片描述

Figure3是關於訓練速度和儲存空間的對比。現在對於模型的改進，可能準確率方面的提升已經很難作為明顯的創新點，因為幅度都不大，因此大部分還是在模型大小和計算複雜度上優化，同時只要準確率還能提高一點就算進步了。

這裡寫圖片描述

作者的最後提到一個如果在測試階段，在網路結構後面加上mean-max pooling 層可以提高準確率，如下圖

這裡寫圖片描述

總結

作者提出的DPN網路可以理解為在ResNeXt的基礎上引入了DenseNet的核心內容，使得模型對特徵的利用更加充分。原理方面並不難理解，而且在跑程式碼過程中也比較容易訓練，同時文章中的實驗也表明模型在分類和檢測的資料集上都有不錯的效果。

《2017-Dual Path Networks》論文解讀

解讀Dual Path Networks（DPN，原創）動機以前方法的不足 ResNet：側重於特徵的再利用，但不善於發掘新的特徵； DenseNet: 側重於新特徵的發掘，但又會產生很多冗餘；優點

論文筆記：Dual Path Networks

首先分析了 ResNet 和 DenseNet。借鑑RNN的表達方式。 k: 當前處於哪個步 t：第t步 ht: 第t步的隱藏狀態：在第k步中，提取第t狀態特徵的函式 gk：第k步，轉換聚合特徵的函式如果，那麼可以寫成：簡化成：其

解讀Dual Path Networks（DPN，原創）

ResNet和DenseNet是近幾年兩種比較熱門的網路結構，ResNet把輸入直接加到（element-wise adding）卷積的輸出上，DenseNet則把每一層的輸出都拼接（concatenate）到了其後每一層的輸入上。在這篇論文中作者用High Order

Dual Path Networks（DPN）——一種結合了ResNet和DenseNet優勢的新型卷積網絡結構。深度殘差網絡通過殘差旁支通路再利用特征，但殘差通道不善於探索新特征。密集連接網絡通過密集連接通路探索新特征，但有高冗余度。

哪裏 esc 數學 itemid tip 視覺 bat tlist badge 如何評價Dual Path Networks（DPN）？論文鏈接：https://arxiv.org/pdf/1707.01629v1.pdf在ImagNet-1k數據集上，淺DPN超過

CVPR 2017 全部及部分論文解讀集錦

計算機視覺頂會之一的CVPR2017將於7月21日至7月26日在夏威夷舉行。目前文章都已出來（連結：http://openaccess.thecvf.com/CVPR2017.py 或者點選底下閱讀原文直接進入），大家可以在週末盡情得閱讀啦。下面為我們整理的一些關

《Dual Path Networks》筆記

（這篇論文是最新的網路結構的論文，故下載下來學習一下） 1 論文出處：image2017多項冠軍，目前掛在arxiv上面 2 主要思路：現在的網路結構，有resnet結構的，兩個通路然後把feature map 相加的（add），也有兩個通路然後把fea

Self-Attention Generative Adversarial Networks 論文解讀

論文地址：https://arxiv.org/abs/1805.08318 Ian goodfellow 2018年新作，在GAN生成中加入了attention的機制，同時將SNgan的思想引入到生成器當中。傳統gan的問題使用小的卷積核很難發現影象中的依賴關係使用大的卷積

基於Dual Path Networks（DPN）的影象識別模型實踐

影象識別模型已經非常多了，但是看到對於DPN的下面表述，動起了將它復現一下的念頭：DPNs helped us won the 1st place in Object Localization Task in ILSVRC 2017, with all competition

論文解讀：Stacked Attention Networks for Image Question Answering

這是關於VQA問題的第二篇系列文章，這篇文章在vqa領域是一篇比較有影響的文章。本篇文章將介紹論文：主要思想；模型方法；主要貢獻。有興趣可以檢視原文：Stacked Attention Networks for Image Question Answering。原論文中附有作者原始碼。

論文解讀：DeLiGAN: Generative Adversarial Networks for Diverse and Limited Data

前言：DeLiGAN是計算機視覺頂會CVPR2017發表的一篇論文，本文將結合Python原始碼學習DeLiGAN中的核心內容。DeLiGAN最大的貢獻就是將生成對抗網路（GANs）的輸入潛空間編碼為混合模型（高斯混合模型），從而使得生成對抗網路（GANs）在數量有限但具有多樣性的訓練資料上表現出較

2017年美國大學生數學建模競賽C題優秀論文解讀

2017年美賽C題賽題 2017 MCM Problem C: “Cooperate andnavigate” Traffic capacity is limited in many regionsof the United States due to the number of lanes

2017年美國大學生數學建模競賽F題優秀論文解讀

2017年美賽F題賽題 2017ICM Problem F: Migration to Mars: Utopian Workforce of the 2100 Urban Society Theinternational agency, Laboratory of Interstellar

CVPR 2017論文解讀：特徵金字塔網路FPN

這裡介紹的文章是來自 Facebook 的特徵金字塔網路 Feature Pyramid Networks(FPN)。FPN 主要解決的是物體檢測中的多尺度問題，通過簡單的網路連線改變，在基本不增加原有模型計算量情況下，大幅度提升了小物體檢測的效能。我們將從論文背景，論

論文解讀之Feature Pyramid Networks for Object Detection

論文名稱：Feature Pyramid Networks for Object Detection 這是一篇CVPR2017的文章，提出一種新型的特徵金字塔網路，作者是何開明等人首先，文章介

論文DenseNet（Densely Connected Convolutional Networks）解讀

Introduction DenseNet在ResNet的基礎上(ResNet介紹)，進一步擴充套件網路連線，對於網路的任意一層，該層前面所有層的feature map都是這層的輸入，該層的feature map是後面所有層的輸入。示意圖如下:

【轉】CVPR 2017論文解讀：用於單目影象車輛3D檢測的多工網路

轉自：https://baijiahao.baidu.com/s?id=1573792022850309&wfr=spider&for=pc 昨日，CVPR 2017獲獎論文公佈，引起了業內極大的關注。但除了這些獲獎論文，還有眾多精彩的論文值得一讀。因此在

阿里NIPS 2017論文解讀：如何降低TensorFlow訓練的視訊記憶體消耗？

阿里妹導讀：被譽為國際頂級的機器學習和神經網路學術會議NIPS 2017於12月4日-9日在美國加州長灘市舉行。在本屆會議上，阿里巴巴除有兩篇論文入選Workshop並進行Oral和Poster形式報告外，三大技術事業部連續3天在阿里展區舉行多場技術研討會，向5000餘名參會人員介紹阿里在機器學習、人工智

論文筆記：Dual Skipping Networks 雙跳網路

Changmao Cheng1∗, Yanwei Fu2∗, Yu-Gang Jiang1†, Wei Liu3, Wenlian Lu4, Jianfeng Feng4, Xiangyang Xue1 1 School of Computer Science, Fudan

NIPS 2017論文解讀 | 基於對比學習的Image Captioning

輪廓檢測論文解讀 | Richer Convolutional Features for Edge Detection | CVPR | 2017

有什麼問題可以加作者微信討論，cyx645016617 上千人的粉絲群已經成立，氛圍超好。為大家提供一個遇到問題有可能得到答案的平臺。 ## 0 概述 - 論文名稱：“Richer Convolutional Features for Edge Detection” - 論文連結：https://opena

《2017-Dual Path Networks》論文解讀

動機

優點

方法

網路結構

實驗結果：

總結

相關推薦