卷積特徵提取與池化（Pooling）——處理大型影象

阿新 • • 發佈：2019-01-05

在之前的章節中，我們已經很好地解決了手寫體識別問題（維數為28*28）。但如果是更大的影象（維數為96*96）呢？如果你還是要學習400個特徵，那麼網路權重引數就有400*96*96即近400萬個。

卷積特徵提取

如果我們從大型彩色影象（64*64*3）中隨機抽取一些小patch（8*8），學到了一些特徵，然後用這些特作為濾波器去掃過整張大圖，即逐行逐列做卷積。這樣做可以大幅減小網路引數W的數量，然而會使輸入分類器的特徵維數大幅度上升。

池化

池化是在卷積特徵提取的基礎上，對每個卷積特徵進行取平均等，繼續縮小隱藏節點對於的卷積特徵維數，減小分類器的設計負擔。

下面列表說明

原始影象為64*64*3的彩色影象

卷積特徵提取取樣8*8的patch

隱藏層節點數統一為400

池化採用19*19的尺寸

可以看到，通過卷積特徵提取和池化後，W數量和分類器輸入特徵數量都同時大幅度下降了。

下面是核心程式碼，使用的資料庫有四種圖片：飛機、汽車、貓、狗，每幅圖的大小就是64*64*3，train圖片2000幅，test圖片3200幅，最後經過漫長的等待：時間已過 3288.054248 秒。

Accuracy:80.406%，結果令人滿意。

cnnExercise

loadSTL10Features%載入線性解碼器提到的特徵

這裡是之前得到的400個特徵

現在拿來當卷積濾波器用

圖1

計算卷積

cnnConvolve

這裡太零散了，直接粘過來整個M檔案好了。

function convolvedFeatures = cnnConvolve(patchDim, numFeatures, images, W, b, ZCAWhite, meanPatch)

numImages = size(images, 4);
imageDim = size(images, 1);
imageChannels = size(images, 3);

convolvedFeatures = zeros(numFeatures, numImages, imageDim - patchDim + 1, imageDim - patchDim + 1);


WT=W*ZCAWhite;%等效W
bT = b - WT*meanPatch;%等效b，這裡要補償均值

convolvedFeatures = zeros(numFeatures, numImages, imageDim - patchDim + 1, imageDim - patchDim + 1);
for imageNum = 1:numImages
  for featureNum = 1:numFeatures

    convolvedImage = zeros(imageDim - patchDim + 1, imageDim - patchDim + 1);
    for channel = 1:imageChannels
      feature = reshape(WT(featureNum,(channel-1)*patchDim*patchDim+1:channel*patchDim*patchDim),patchDim,patchDim); % 取出各通道patch
      feature = flipud(fliplr(squeeze(feature)));
      im = squeeze(images(:, :, channel, imageNum));
      convolvedImage=convolvedImage+conv2(im,feature,'valid'); %計算卷積    
    end
    convolvedImage=sigmoid(convolvedImage+bT(featureNum));    
    convolvedFeatures(featureNum, imageNum, :, :) = convolvedImage;
  end
end
end
function sigm = sigmoid(x)
    sigm = 1./(1+exp(-x));
end

計算池化

cnnPool

cnnPool
for imageNum=1:numImages
    for featureNum=1:numFeatures
        for poolRow=1:convolvedDim/poolDim
            offsetRow=1+(poolRow-1)*poolDim;
            for poolCol=1:convolvedDim/poolDim
                offsetCol=1+(poolCol-1)*poolDim;
                patch=convolvedFeatures(featureNum, imageNum,offsetRow:offsetRow+poolDim-1,offsetCol:offsetCol+poolDim-1);
                pooledFeatures(featureNum,imageNum,poolRow,poolCol) = mean(patch(:));
            end
        end
    end
end

歡迎參與討論並關注本部落格和微博以及知乎個人主頁後續內容繼續更新哦~

轉載請您尊重作者的勞動，完整保留上述文字以及文章連結，謝謝您的支援！

卷積特徵提取與池化（Pooling）——處理大型影象

卷積特徵提取與池化（Pooling）——處理大型影象

pytroch如何對線性層進行池化（pooling）？Expected 3-dimensional tensor, but got 2-dimensional tensor for argument

10、Caffe學習與應用 -訓練（卷積層引數、池化層引數、學習率、正則化）

非監督特徵學習與深度學習（九）----使用卷積進行特徵提取

利用Python實現卷積神經網路的視覺化（附Python程式碼）

用於視覺識別的深度卷積網路空間金字塔池化方法

CS231n 卷積神經網路與計算機視覺 6 資料預處理權重初始化規則化損失函式等常用方法總結

卷積神經網路各種池化

卷積神經網路簡單的應用（一）：目的與資料

卷積神經網路簡單的應用（二）：模型構建與訓練

FCN用卷積層代替FC層原因（轉）

session的活化與鈍化（轉）

利用tensorflow實現簡單的卷積神經網路——遷移學習小記（二）

QT design的安裝與漢化（pycharm）

Coursera吳恩達《卷積神經網路》課程筆記（1）-- 卷積神經網路基礎

卷積神經網路簡單的應用（三）：模型測試

深度學習之卷積神經網路原理詳解（一）

深入理解Linux網路技術內幕——裝置的註冊與初始化（一）

Android熱修復與外掛化（四）AndFix

卷積神經網路的直觀解釋（筆記）

卷積特徵提取與池化（Pooling）——處理大型影象

相關推薦