caffe中卷積計算詳解

阿新 • • 發佈：2019-02-19

卷積是卷積神經網路的重要組成部分，消耗整個網路中大量計算資源，理解卷積計算過程，對優化網路結構和簡化網路模型非常重要。

正常卷積的實現如下圖所示：

非常重要的是：卷積核其實和特徵圖一樣，是一個三維矩陣，這點需要注意。

上圖是一個典型的卷積過程。第一列是一個7*7*3的特徵圖；第二列是第一個卷積核，大小為3*3*3；第三列是第二個卷積核，大小為3*3*3；第四列得到了兩個輸出特徵圖，第一個是原特徵圖和第一個卷積核卷積得到的，第二個是原特徵圖和第二個卷積核卷積得到的。

計算：第二列的卷積核的第一個3*3模板在第一個特徵圖上進行加權迭代，得到值為-3；第二個3*3模組在第二個特徵圖對應位置，進行同樣的操作，得到4；第三個得到0；最後，加上偏置1，即：-3+4+0+1=2。按這樣的計算規則，卷積核在原特徵圖上進行滑動遍歷，最終得到了第四列，第一個輸出特徵圖。第三列的卷積核計算同上，得到了第四列，第二個輸出特徵圖。

乘法次數：即進行了幾次乘法，第一個卷積核進行了(3*3)*3次乘法，兩個卷積核共2*(3*3)*3次。

引數個數：即權值個數，第一個卷積核有(3*3)*3個引數，加上一個偏置，共(3*3)*3+1=28個引數。所以，兩個卷積核共28*2=56個引數。

那麼，卷積過程，在caffe程式碼中是怎麼實現的呢？如下圖所示：

上圖類似上面的卷積過程，輸入特徵圖大小為：in_channels*in_height_*in_width,卷積核大小為:in_channels*k_height_*k_width（注意：卷積核channels和輸入特徵圖的channels相同

），輸出特徵圖大小為：out_channels*out_height_*out_width。

caffe實現時，先將輸入特徵圖和卷積核都轉化為矩陣，計算好了再還原，如下圖：

將輸入特徵圖中，卷積部分的那個區域中資料(原特徵圖中)，轉變為一列，如果channels為1，則列長為k_height_*k_width，否則為in_channels*k_height_*k_width。當卷積核移動一次，對應的區域資料又形成了新的一列，卷積核一用移動out_height_*out_width次，這樣輸入特徵圖矩陣的寬度就為out_height_*out_width。所以，就形成了一個(in_channels*k_height_*k_width)*(out

_height_*out_width)的矩陣。同上，得到一個(out_channles)*(in_channels*k_height_*k_width)的卷積核矩陣。
用卷積核矩陣*輸入特徵圖矩陣，得到(out_channles)*(out_height_*out_width)大小的輸出特徵圖矩陣，還原後得到out_channles個out_height_*out_width大小的特徵圖。
以上，即為卷積計算的詳細步驟。
本部落格中提到了乘法次數，當然也有加分次數，這些都是實際開發中，需要考慮的。開發中需要根據演算法的浮點運算次數，來權衡選擇何種處理晶片。

caffe中卷積計算詳解

caffe中卷積計算詳解

TensorFlow與caffe中卷積層feature map大小計算

Caffe中卷積運算的原理與實現

關於影象卷積與caffe中卷積實現

Caffe中卷積層的實現

影象處理中的數學原理詳解17——卷積定理及其證明

Caffe、Tensorflow及Matlab中的卷積計算

CNN中卷積層的計算細節

位運算中的左移和右移的計算詳解

CNN中卷積層的詳細計算

AI晶片：高效能卷積計算中的資料複用

JavaScript中return的用法詳解

Android中的windowSoftInputMode屬性詳解

java中的instanceof用法詳解

java中Collections.sort排序詳解

使用Caffe完成圖像目標檢測和 caffe 全卷積網絡

命令提示符（cmd）中的tracert命令詳解

struts2中result參數詳解

BLAST+中makeblastdb參數詳解

WPF中的Command命令詳解

caffe中卷積計算詳解

相關推薦