Deformable Convolution Net論文筆記

阿新 • • 發佈：2018-12-08

論文大致背景及思路
a. MSRA在2017年的作品，最近出了V2版本。
b. 提出了兩個模組用於加強CNN對變形的適應能力。
c. 對於幾何變化，目前有兩種方法：
i. 構造一個足夠強的資料集
ii. 使用一些具有旋轉變形不變性的特徵演算法，比如SIFT
d. 上述方法有兩個問題：
i. 我們假定了這些幾何變化都是固定且已知的，那麼在處理未知情況時，就無法很好地得到結果了。
ii. 手工設計的特徵很難適應複雜的變化。
e. 那麼強大如CNN，能否解決這個問題呢，答案也是否定的。由於CNN的結構中並不包含能處理幾何變化的模組，這就造成了在同一層上，所有的啟用單元的感受野都是一樣的。那麼，較高層就無法很好的在空間位置上進行語義的編碼，因為不同的位置可能對應著不同尺寸和變形的物體。
f. 作者提出了deformable convolution 也就是在標準卷積中加入了增加了一層偏移量，使得可以響應不同形狀的物體。如下圖。偏移量通過輸入的特徵圖學習得到。

g. 第二個部分就是deformable RoI pooling。也是在普通的RoI pooling前對每一塊bin都增加了偏移量。也是從前一層學習得到。
網路結構
a. Deformable Convolution：
i. 對於標準卷積，我們可以如下定義：

其中：

ii. 而我們在其中加入偏移量，使得可以響應不同形狀位置。即

可以預料，這個偏移量大概率並不是一個整數，那麼我們該如何得到對應的位置的值呢。這裡使用雙線性插值：

那麼這個該如何反向傳播呢，挖個坑，待推導。
iii. 3*3的卷積核對應的deformable convolution示意圖如下：
首先通過一個普通卷積，得到一個和輸入解析度一致的特徵圖，但是通道數翻倍，對應於X，Y兩個軸。然後再和輸入圖進行帶偏移量的卷積。
b. Deformable RoI Pooling
i. 首先普及一下RoI Pooling：對於每個W大小的RoI，我們把它劃分為k

k個塊，然後對每一塊計算均值，得到一個kk的輸出。
ii. 現在我們加上Deformable，也就是也加上一個偏移量。我們先進行一次pooling，然後通過一個全連線層買得到歸一化的偏移量。這裡對於偏移量的操作並不理解，挖坑。
iii. PS RoI Pooling：這裡和RoI Pooling大不相同，我們要產生kk*(c+1)通道數的分數圖，對應於kk個bin和C個類。然後就是相似的給出2通道數的偏移值，對原本的分數圖加偏移量，得到結果。
c. Deformable ConvNets：
i. 由於上述模組的輸入輸出和標準模組是一樣的，所以可以直接替代對應的模組。訓練還是靠反向傳播。
ii. 效果示意如下：

iii. 思路總體來源於根據目標任務，學習和新增偏移量，增大在卷積和池化時的空間取樣位置。

PS：這篇文章看的不太清楚，還需要通過看原始碼和反覆研讀才能透徹理解。

Deformable Convolution Net論文筆記

論文大致背景及思路 a. MSRA在2017年的作品，最近出了V2版本。 b. 提出了兩個模組用於加強CNN對變形的適應能力。 c. 對於幾何變化，目前有兩種方法： i. 構造一個足夠強的資料集 ii. 使用一些具有旋轉變形不變性的特徵演算法，比如SIFT d. 上述方法有兩個

IoU-Net論文筆記

論文背景及大致思路 a. 清北，Face++，頭條四家聯合出品，一看就是有點厲害的文章。發表於ECCV2018. b. 文章從我們常常忽略的定位的準確率出發，提出了利用預測IoU來輔助檢測的IoU Net。在多個數據集上得到了當前的最佳效果。發現的問題和主要工作 a

SPP-Net（Spatial Pyramid Pooling Network）論文筆記

1. 論文思想 SPP-Net的提出首先是為了解決傳統CNN網路對於輸入影象尺寸具有嚴格的大小限制，其原因也就是最後的全連線層需要的輸入尺寸是固定的。那麼對於一副比較大的影象就需要進行剪裁了，如下圖所示：但是這樣會造成資料失真以及資料的不完整。那麼，要使CNN網路可以接受任意影象

《B/S模式下ADO.NET資料庫訪問技術的設計及應用》論文筆記（十七）

一、基本資訊標題：B/S模式下ADO.NET資料庫訪問技術的設計及應用時間：2014 來源：電子測試關鍵詞：B/S模式; ADO.NET資料庫訪問技術; 設計; 應用; 二、研究內容 1.ADO.NET資料庫訪問技術的兩種模式：連線模式下的資料庫訪問技術：

簡潔版 CVPR-2017論文筆記《Active Convolution: Learning the Shape of Convolution for Image Classification》

作者提出一種靈活的卷積單元，形狀在訓練中學習得到，這種結構使得網路具有更強的表達能力。這篇論文提出了一種新的卷積單元，主動卷積單元ACU（Active Convolution Unit）,在次之前，從AlexNet到如今的ResNet，GoogleNet等各種網路架構的提出，人們研究的基本

論文筆記《Active Convolution: Learning the Shape of Convolution for Image Classification》

研究背景近年來，深入學習在許多計算機視覺應用中取得了巨大的成功。傳統的卷積神經網路（CNN）成為最近幾年計算機視覺研究的主要方法。 AlexNet 迄今為止，關於CNN的大多數研究集中在開發諸如Inception , residual networks的這種網路結構上。

ECO: Efficient Convolution Operators for Tracking視訊目標跟蹤論文筆記（PPT版）

論文標題：ECO: Efficient Convolution Operators for Tracking 作者：Martin Danelljan 等發表會議：CVPR 2017（目前的狀態為已

.NET學習筆記之ADO.NET

技術分享 reader sql語句 bsp 技術 area ada 執行sql 學習據提供程序： Connection，用來連接數據庫 Command，用來執行SQL語句 DataReader只讀，只進的結果集，一條一條讀取數據 DataAdapter，一個封裝了上面3個

,NET學習筆記之ADO.NET

nbsp png alt 學習 log logs ima http blog ,NET學習筆記之ADO.NET

論文筆記：目標追蹤-CVPR2014-Adaptive Color Attributes for Real-time Visual Tracking

exploit orm dom ons tail red 最好早期形式化基於自適應顏色屬性的目標追蹤 Adaptive Color Attributes for Real-Time Visual Tracking 基於自適應顏色屬性的實時視覺追蹤 3月講的第一

論文筆記之 SST: Single-Stream Temporal Action Proposals

ron 我們裁剪只需要 lock proposal 數據 function 性能 SST: Single-Stream Temporal Action Proposals 2017-06-11 14:28:00 　　本文提出一種時間維度上的 proposal

Selective Search for Object Recognition 論文筆記【圖片目標分割】

line 單個介紹 images 分層什麽但是如果抽樣這篇筆記，僅僅是對選擇性算法介紹一下原理性知識，不對公式進行推倒. 前言：這篇論文介紹的是，如果快速的找到的可能是物體目標的區域，不像使用傳統的滑動窗口來暴力進行區域識別.這裏是使用算法從多個維度對找

QuartZ .Net 學習筆記一: 源碼下載與查看

net href cnblogs 方法 category solution ges 博客存在最近因為工作需要研究一下QuartZ .net , 之前也用過不過但沒有深入了解, 現想深入研究一下網上相關QuartZ .net 的文章不少, 但大部分都是源於張善友的博

Deep Learning論文筆記之（二）Sparse Filtering稀疏濾波

structure 分布的確 tlab bolt 期望有一個尋找 mean Deep Learning論文筆記之（二）Sparse Filtering稀疏濾波自己平時看了一些論文，但老感覺看完過後就會慢慢的淡忘，某一天重新拾起來的時候又好像沒有

Semi-supervised Segmentation of Optic Cup in Retinal Fundus Images Using Variational Autoencoder 論文筆記

str 很好流程 Coding 測試 eat www tin nal MICCAI 2017年論文 Overview：視杯視盤精確分割後，就可以計算杯盤比了，杯盤比是青光眼疾病的主要manifestation。以往的方法往往采用監督學習的方法，這樣需要大量的精確像素

ASP.NET學習筆記（4）——上傳圖片

bmi guid ted 介紹 dir filename content put ima 說明（2017-10-8 23:03:43）： 1. 後面的內容都是一些雜七雜八的，零零碎碎的，之前都直接略過了，不過其實還是挺重要的，這次重新學習要認認真真敲一遍。 2. 明天中午9

ASP.NET學習筆記（6）——jQuery的Ajax基本操作

stat password ash page serve () c# content scrip 說明（2017-11-5 15:49:29）： 1. jQuery裏封裝了三個方法，$.get,$.post和$.ajax,其中$.ajax是返回原生的XMLHttpReque

論文筆記之：Collaborative Deep Reinforcement Learning for Joint Object Search

region format es2017 join sid col str bottom respond Collaborative Deep Reinforcement Learning for Joint Object Search CVPR 2017 Motiva

論文筆記-Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation

mach default rap lin -s rnn alias for wrap 針對機器翻譯，提出 RNN encoder-decoder. encoder與decoder是兩個RNN，它們放在一起進行參數學習，最大化條件似然函數。網絡結構：註意輸入語句與

論文筆記-Sequence to Sequence Learning with Neural Networks

map tran between work down all 9.png ever onf 大體思想和RNN encoder-decoder是一樣的，只是用來LSTM來實現。 paper提到三個important point： 1）encoder和decoder的LSTM

Deformable Convolution Net論文筆記

相關推薦