Visualizing and Understanding Convolutional Networks 閱讀筆記-網路視覺化NO.1

阿新 • • 發佈：2019-01-04

Visualizing and Understanding Convolutional Networks 閱讀筆記

綜述：此篇paper是CNN視覺化的開山之作(由Lecun得意門生Matthew Zeiler發表於2013年)，主要解決了兩個問題
　１）why CNN perform so well?
　２）how CNN might be improved?
背景介紹：
　１）近些年來，CNN針對影象分類問題有著令人驚歎的效果，2012年的AlexNet(test error:15.3%)碾壓第二名(test error:26.2%),由此CNN如雨後春筍般瘋狂生長，CNN之所以成功主要歸功於三個方面：①數以百萬計的帶標籤資料，②強大的GPU計算能力，③更好的正則化處理
　2）提出問題：訓練出來的CNN模型為什麼能夠奏效？怎樣奏效？在科研方面，這些問題並沒有得到解決。論文介紹了CNN各層到底學到了原始影象的什麼特徵以及這些特徵對最終預測結果的影響力度
實現（paper的展開以2013年的ZFNet=5層conv+3層FC 為基礎，在此基礎上進行了略微調整(such as:kernel size、stride)，並提升了效果）
　1）我們都知道ZFNet以conv+ReLU+Maxpooling為主要的實現方式，“看懂並理解”網路就是這個過程的逆過程，即Unpooling+ReLU+反捲積，下面我們分別進行介紹：
　2）Unpooling：毫無疑問，maxpooling是一個不可逆過程，例如在一個3*3的pool中，我們選擇9個元素的最大值進而實現降取樣，我們必然會損失其他8個元素的真實資料。實現過程中，我們需要記錄pool中最大值的位置資訊，我們稱之為“Switches”表格，在unpooling過程中，我們將最大值直接放回該位置，將其他位置直接置0；
　3）ReLU：在CNN中，我們使用ReLU作為啟用函式是為了修正feature map，使其恆不為負，為了重構每一層的輸出，這種約束依然成立，我們繼續使用ReLU；
　4）反捲積：CNN中，上層的輸出與學習到的filters進行卷積，得到本層的特徵，逆過程的實現就是通過使用相同卷積核的轉置，與矯正之後的特徵進行卷積，從而實現反捲積。這時候便產生了疑問？為什麼使相同卷積核的轉置？下面將進行粗淺說明：

　注：假設在某次的卷積過程如圖所示，feature map size=4*4,padding=0,strides=1，則會產生2*2的feature map
　1.將輸入矩陣（藍色）展開為16維向量，記作x
　2.將輸出矩陣（綠色）可展開為4維向量，記作y
　3.由1，2可知，卷積運算可表示為y = Cx，正向傳播時接收16維，輸出4維；反向傳播時接收4維，輸出16維，正向傳播與反向傳播可類比於卷積與逆卷積運算，其中的C為：
　
　注：其中的 $w_{i, j}$ 代表卷積核的中的元素,推導過程如下：
　
　具體實現過程如圖所示：

　
　注：Max Locations “Switches”在maxpooling過程中儲存了最大值得座標資訊，反捲積的卷積核使用的是相同卷積核的轉置
訓練細節
　1）dataset:模型使用的資料集是ImageNet 2012 training set (130萬張照片, 1000個種類)，每張照片都從中間擷取256*256大小的圖片，而後減去所有訓練圖片畫素的均值，每張圖片使用10個不同的field，可以通過水平翻轉+移動方式獲得
　2）training:初始學習率0.01，使用SGD學習方式，minibatch為128，momentum動量為0.9，當validation error平穩時對learning rate進行調節，在fc層我們使用dropout(rate為0.5)
網路視覺化
　１）網路每層的視覺化結果展示了網路層次化的特點，較低的網路層級學到的特徵較為明顯，一般表現為顏色、形狀、紋理，隨著網路層級的加深，網路學到的特徵越抽象。同時，較低的網路層級收斂速度較快，但對輸入影象的敏感性很高；較高層級收斂速度較慢，但對輸入影象的魯棒性較高。
　２）CNN模型對影象的平移、縮放具有較強的魯棒性，但影象的旋轉操作會對CNN的feature map影響較大。效果如下圖所示：
　
　注：a1,b1,c1分別是對原始影象進行垂直移動、放大、旋轉等操作；a2,b2,c2和a3,b3,c3分別是對應變化與原始影象在layer1和layer7中feature的歐幾里得距離；a4,b4,c4分別是預測正確的概率(其中有兩個class預測正確的概率超級低，不知道為什麼。。。不過目前的這個結果已經足夠有意思了，哈哈哈)
部分影象遮擋對分類結果的影響
　實驗證明，當對影象的關鍵位置進行遮擋時，影象預測正確的概率將大大降低
　論文中還做了一個實驗，很有意思，如下圖所示：
　
　注：圖片展示了對原始影象進行不同部位的遮擋，第１列為原始影象，第２，３，４分別是對狗的左眼、右眼、鼻子進行遮擋，其他列則是隨機進行遮擋，layer5和layer7的
　
　注：layer5關注區域性特徵，而layer7則關注類別特徵（原文:Measure of correspondence for dierent object parts in 5 different dog images. The lower scores for the eyes and nose (compared to random object parts) show the model implicitly establishing some form of correspondence of parts at layer 5 in the model. At layer 7, the scores are more similar, perhaps due to upper layers trying to discriminate between the different breeds of dog.）
之後論文詳細闡述瞭如何重構Alexnet、做出的哪些微調以及最終的效果，此處不再贅述

Summary：論文通過conv+ReLU+maxpooling的逆過程視覺化CNN，並通過觀察重構結果調整網路結構，提高了模型精確度。是網路視覺化的開山經典之作，而後還有幾篇視覺化的經典之作，如下：
1）《Visualizing and Understanding Convolutional Networks》–就是此篇開創了視覺化的先河
2）《Deep Inside Convolutional Networks: Visualising Image Classification Models and Saliency Maps》
3）《Learning Deep Features for Discriminative Localization》
4）《Grad-CAM:Visual Explanations from Deep Networks via Gradient-based Localization》
有時間的話，再和大家一起分享

*作者：gengmiao 時間：2018.02.18,原創文章，轉載請保留原文地址、作者等資訊*

Visualizing and Understanding Convolutional Networks 閱讀筆記-網路視覺化NO.1

Visualizing and Understanding Convolutional Networks 閱讀筆記綜述：此篇paper是CNN視覺化的開山之作(由Lecun得意門生Matthew Zeiler發表於2013年)，主要解決了兩個問題　１）

Grad-CAM:Visual Explanations from Deep Networks via Gradient-based L閱讀筆記-網路視覺化NO.3

Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization 閱讀筆記這是網路視覺化的第三篇，其餘兩篇分別是： ①《Visualizing and

Visualizing and Understanding Convolutional Networks筆記

Contents 本文為20141024週報。在所有深度網路中，卷積神經網和影象處理最為密切相關，卷積網路在很多圖片分類競賽中都取得了很好的效果，但卷積網調參過程很不直觀，很多時候都是碰運氣。為此，卷積網路發明者Yann LeCun的得意門生Matthew Ze

Visualizing and Understanding Convolutional Networks翻譯總結

Zfnet 論文：《Visualizing and Understanding Convolutional Networks》 1. 概述這篇論文主要的貢獻是將卷及神經網路的隱藏層的特徵進行視覺化，後面通過視覺化的展示來分析如何構建更好的網路結構。最後還描述了該網

【CV+DL學習路02】CNN視覺化學習2——Visualizing and Understanding Convolutional Networks

第二篇論文記錄，對於第一次搜尋文獻的本小白和為圖偷懶第一篇論文直接看的翻譯的本童鞋來說，真的是。。。。做科研不能偷懶，不然後面是真有點麻煩，在經過了三天的谷歌加百度加CSDN下載了10多篇文章不知道先看那一篇之後，我終於確定了要看的第二篇和第三篇論文。。。。也是無語了這篇論文

CNN入門必讀經典：Visualizing and Understanding Convolutional Networks

本文主要是藉助deconvnet來視覺化卷積網路，這對於理解卷積網路還是非常重要的，同時本文又是13年ImageNet分類任務的冠軍。程式碼： https://github.com/guruucsd/CNN_visualization 1 Decon

Visualizing and Understanding convolutional networks

Large convolutional networks model on ImageNet (Krizhevsky, A., Sutskever, I. and Hinton, G. E. ImageNet Classification with Deep Convo

深度學習論文翻譯解析（十）：Visualizing and Understanding Convolutional Networks

論文標題：Visualizing and Understanding Convolutional Networks 　　標題翻譯：視覺化和理解卷積網路論文作者：Matthew D. Zeiler Rob Fergus 論文地址：https://arxiv.org/pdf/1311.2901v3.

Flower classification using deep convolutional neural networks 閱讀筆記

** Flower classification using deep convolutional neural networks ** 本部落格主要是對該篇論文做一個閱讀筆記，用FCN+CNN去做識別期刊： IET Computer Vision 內容：（1）自動分割

Towards End-to-end Text Spotting with Convolutional Recurrent Neural Networks閱讀筆記

1.摘要論文提出一種統一的網路結構模型，這種模型可以直接通過一次前向計算就可以同時實現對影象中文字定位和識別的任務。這種網路結構可以直接以end-to-end的方式訓練，訓練的時候只需要輸入影象，影象中文字的bbox，以及文字對應的標籤資訊。這種end-to-end訓練的

Visualizing and Understanding ConvNet---CNN可視化理解

卷積 ati 分享 adding 分享圖片 deep -c pool learn 1. 感受野的定義(receptive field) ? ? ? ?此處拋出感受野(receptive field)的定義和理解： ? ? ? ?感受野其實就是卷積神經網絡每一層輸出的特征圖

Look into Person: Joint Body Parsing & Pose Estimation Network and A New Benchmark閱讀筆記

ati 技術分享 mar 最大 ali ndt and 兩個 mat Look into Person: Joint Body Parsing & Pose Estimation Network and A New Benchmark閱讀筆記這篇論文主要是兩個貢獻

cs231 卷積神經網路Convolutional Networks群組歸一化GN( Group Normalization)

cs231 Convolutional Networks Group Normalization: def spatial_groupnorm_forward(x, gamma, beta, G, gn_param): """ Co

cs 231 Convolutional Networks 卷積網路 Fast layers (Cython extension)

cs 231 Convolutional Networks 卷積網路 Fast layers (Cython extension): 快速卷積和池化層是很有挑戰性的，為了使大家不感到痛苦，cs231官網提供了cs231n/fast_layers.py檔案中卷積層

Dihedral angle prediction using generative adversarial networks 閱讀筆記

使用生成對抗網路的二面角預測 Abstract 為蛋白質結構預測及其他應用開發了幾種二面角預測方法。然而，預測角度的分佈與實際角度的分佈不同。為了解決這個問題，我們採用了生成對抗網路（GAN），它在影象生成任務中顯示了有希望的結果。生成性對抗網路由兩

Densely Connected Convolutional Networks 論文筆記

0 摘要最近的成果顯示，如果神經網路各層到輸入和輸出層採用更短的連線，那麼網路可以設計的更深、更準確且訓練起來更有效率。本文根據這個現象，提出了Dense Convolutional Network (DenseNet)，它以前饋的方式將每個層都連線

[深度學習論文筆記][Visualizing] 網路視覺化部分論文導讀

There are several ways to understanding and visualing CNN 1 Visualizing Activations Show the activations of the network during the forwar

Learning Spatiotemporal Features with 3D Convolutional Networks學習筆記

Learning Spatiotemporal Features with 3D Convolutional Networks Du Tran, Lubomir Bourdev, Rob Fergus, Lorenzo Torresani, Manohar

caffe網路視覺化的多種方式

文章目錄寫在前面 draw_net pycaffe工具 Netscope 線上caffe網路視覺化編輯工具寫在前面在caffe網路的訓練和除錯的過程中，將網路結構視覺化，可以更加直觀地進行網路調整，將ca

基於Pytorch實現網路視覺化（CS231n assignment3）

這篇部落格主要是對CS231n assignment3中的網路視覺化部分進行整理。我使用的是Pytorch框架完成的整個練習，但是和Tensorflow框架相比只是實現有些不一樣而已，數學原理還是一致的。 &nbs

Visualizing and Understanding Convolutional Networks 閱讀筆記-網路視覺化NO.1

Visualizing and Understanding Convolutional Networks 閱讀筆記

相關推薦