(轉載)感受野和座標對映的計算，以及卷積層跟全連線層的區別

阿新 • • 發佈：2019-01-22

轉自：http://blog.cvmarcher.com/posts/2015/05/17/cnn-trick/

這篇文章主要講一下Convolutional Neural Network(CNN)裡面的一些概念以及技巧。

Receptive Field (感受野)

這是一個非常重要的概念，receptive field往往是描述兩個feature maps A/B上神經元的關係，假設從A經過若干個操作得到B，這時候B上的一個區域areab只會跟a上的一個區域相關areaa，這時候areaa成為areab的感受野。用圖片來表示：

在上圖裡面，map 3裡1x1的區域對應map 2的receptive field是那個紅色的7x7的區域，而map 2裡7x7的區域對應於map 1的receptive field是藍色的11x11的區域，所以map 3裡1x1的區域對應map 1的receptive field是藍色的11x11的區域。

那麼很容易得出來，receptive field的計算公式如下：

對於Convolution/Pooling layer:

ri=si⋅(ri+1−1)+kiri=si⋅(ri+1−1)+ki

其中ri表示第i層layer的輸入的某個區域，si表示第i層layer的步長，ki表示kernel size，注意，不需要考慮padding size。

對於Neuron layer(ReLU/Sigmoid/…)

ri=ri+1ri=ri+1

Coordinate Mapping

通常，我們需要知道網路裡面任意兩個feature map之間的座標對映關係，如下圖，我們想得到map 3上的點p

3p3映射回map 2所在的位置p2p2。

計算公式如下：

對於Convolution/Pooling layer:

pi=si⋅pi+1+(ki−12−paddingi)pi=si⋅pi+1+(ki−12−paddingi)

其中pi表示第i層layer的輸入的某個點，si表示第i層layer的步長，ki表示kernel size，paddingi

對於Neuron layer(ReLU/Sigmoid/…)

pi=pi+1pi=pi+1

上面是計算任意一個layer輸入輸出的座標對映關係，如果是計算任意feature map之間的關係，只需要用簡單的組合就可以得到，下圖是一個簡單的例子：

Convolutionalize (卷積化)

最近掀起了FCN(全卷積網路)風，這種網路裡面不包括全連線層(fully connected layer)。

卷積層跟全連線層的區別

卷積層的操作跟傳統的滑窗(sliding windows)很相似，把kernel作用於輸入的不同的區域然後產生對應的特徵圖，由於這樣的性質，給定一個卷積層，它並不要求輸入是固定大小的，它可能根據輸入大小的不同而產生大小不一樣的特徵圖。

全連線層的操作是把輸入拉成一個一維的向量，然後對這一維的向量進行點乘，這就要求輸入大小是固定的。

那麼如果使用一個包含fc層的模型(如AlexNet)就必須使用固定大小的輸入，其實有時候這是非常不方便以及不合理的，比如下圖，如果我要把紅框的塔輸入網路，就必須得對它進行變成，假設是放到AlexNet裡面，因為輸入是224x224，那麼就會對圖片產生變形。

那麼有沒有辦法使得網路可以接受任意的輸入？實際上是可以的，只需要把全連線層變成卷積層，這就是所謂的卷積化。這裡需要證明卷積化的等價性。直觀上理解，卷積跟全連線都是一個點乘的操作，區別在於卷積是作用在一個區域性的區域，而全連線是對於整個輸入而言，那麼只要把卷積作用的區域擴大為整個輸入，那就變成全連線了，我就不給出形式化定義了。所以我們只需要把卷積核變成跟輸入的一個map的大小一樣就可以了，這樣的話就相當於使得卷積跟全連線層的引數一樣多。舉個例子，比如AlexNet，fc6的輸入是256x6x6，那麼這時候只需要把fc6變成是卷積核為6x6的卷積層就好了。

(轉載)感受野和座標對映的計算，以及卷積層跟全連線層的區別

Receptive Field (感受野)

Coordinate Mapping

Convolutionalize (卷積化)

卷積層跟全連線層的區別

(轉載)感受野和座標對映的計算，以及卷積層跟全連線層的區別

CNN卷積層到全連線層的輸入格式變換錯誤 tf.reshape()和slim.flatten()

卷積神經網路入門一種全卷積神經網路（LeNet），從左至右依次為卷積→子取樣→卷積→子取樣→全連線→全連線→高斯連線測試最後，為了檢驗 CNN 能否工作，我們準備不同的另一組圖片與標記集（不能在訓練

徹底搞懂感受野的含義與計算

安卓工作室 android studio文件和代碼模板，以及漢化出錯問題

JFileChooser和FileFilter的使用，以及Java RandomAccessFile用法

函數提升和變量提升，以及他們的優先級

Lucene.net(4.8.0) 學習問題記錄五: JIEba分詞和Lucene的結合，以及對分詞器的思考

Jsの數組練習-求一組數中的最大值和最小值，以及所在位置

Spring的AOP（xml和註解實現AOP，以及代理模式）

TCP的三次握手和四次揮手，以及相關的面試問題詳細解釋

關於SSD訓練時預設框輸出層輸出通道num_output的計算，關於SSD訓練時預設框輸出層輸出通道num_output的計算

addEventLister和attachEvent的作用，以及兩者的區別

Linux基本內容介紹(5) --rpm與yum的使用，at和crontab命令簡介，以及sed的常用操作

前端-CSS（x、y、z）座標的含義，以及變換的使用

linux redhat 安裝gcc gcc-c++和下載到本地，以及可能出現的問題

iOS建立.a和.framework靜態庫，以及Bundle資原始檔的使用

jqgrid-parmNames和jsonReader的使用，以及json的返回格式

qml中註冊和使用C++物件，以及在qml中實現窗體最大最小化

關於機器人抓取的兩篇文章，基於深度學習和脈衝神經網路，以及大腦見圖

(轉載)感受野和座標對映的計算，以及卷積層跟全連線層的區別

Receptive Field (感受野)

Coordinate Mapping

Convolutionalize (卷積化)

卷積層跟全連線層的區別

相關推薦