文中比較重要的引用了幾個篇部落格，開篇給與博主感謝
記錄我從零到實現一個具體CNN網路中最有用的知識乾貨
以細節為切入點，分享我對CNN網路的簡潔
本文致力於讓你一篇文章理解CNN的具體實現與訓練方法
涉及理論不一一追述背景，主要講解其如何應用
開源的優秀CNN程式碼很多，我選擇的入門可能不是最棒的，但對我是最容易理解的

開始

一、神經網路與卷積

1、如果你不瞭解神經網路，這篇 CNN筆記：通俗理解卷積神經網路夠了。
2、如果你不瞭解神經網路，這篇 CNN筆記：通俗理解卷積神經網路也夠了。
3、看黑板標重點，看完文章請確保理解：卷積、池化（取樣）、全連線
4、這一條只是單純地給上文的博主點10個贊。。。。。。。。。

二、一個簡單的CNN結構

1、首先我們需要了解一個數據集MINST，剛去搜了一篇介紹比較詳細的部落格MNIST資料集解析，不過程式碼是Python如果不懂請選擇忽略，看他關於MINST的介紹就好。不過你也可以先跳過這步，這只是輸入資料，並不關乎我們的CNN構架。
2、如果上文你瞭解了卷積，那麼現在可以給你介紹一個簡單的CNN手寫識別網路了。這也有一篇很好的部落格編寫C語言版本的卷積神經網路CNN之網路的總體結構，篇末有一份博主的C語言程式碼連線，純C語言的自己注意修改一下程式碼中載入的檔案路徑，執行起來不是很難。不過文章的配圖，和公式說明比較複雜，所以就只建議閱讀tostq的專欄的篇二（就是上一個連線）。
3、在此送一張我自己畫的圖，姑且稱為圖一

。

三、根據圖一而來的正向計算

先說明一下本文采用的啟用函式Sigmoid()，表示式S(x)=1/[1+exp(−x)]。它有一個很好的特性其導函式與其輸出有關，即S~(x)=S(x)∗[1−S(x)]。
在之後的文章裡我們用f(y)=y∗(1−y)=S(x)∗[1−S(x)]=S~(x) 表示啟用函式的導函式，文章內引用不再重複說明。

3.1、卷積層C1、C3的計算

以ym(x,y)表示第m張輸出圖位置(x,y)的畫素資訊，bm表示偏置，Xp(x,y)示第p張輸入圖，Kpm(j,i)表示當前輸入圖與輸出圖之間的卷積核，W、H分別表示卷積核的寬、高。可以得到輸出圖每個畫素值的計算公式，如下：

ym(x,y)=S([∑pN∑iH∑jWXp(x+j,y+i)∗Kpm(j,i)]+bm)

這裡解釋多說一下卷積一般來說有三種：1、種卷積操作之後影象變大（原圖補充mapSize-1圈畫素）；2、種卷積操作之後影象不變（原圖補充(mapSize-1)/2圈畫素）；3、一種卷積操作之後影象減小（原影象大小不變）。
這裡採用第三種，上式中(i,j)範圍是[0,0]~[4,4]，那麼(x+j,y+i)的範圍是[0,0]~[x+4,y+4]。所以如果輸入影象大小是12*12，那麼得到的輸出圖只有8*8 （inputSize-mapSize+1）。這也就是為什麼會有前兩種卷積拓展畫素的做法。

3.2、取樣層S2、S4的計算

如果看到這你已經知道了取樣的含義，那麼這將是最簡單的一部分實現。我想偷懶原諒我。在本文中的做法是每次從前一層互不重疊的取2*2矩陣並計算平均值。所以本文采樣層較之前一層邊界會縮小一半。

3.3、輸出層O5

由3.1和3.2得到取樣層S4以後，我們將S4的12張圖展開，可以得到12*4*4 =192個數據，由於資料規模相對較小，這裡採用全連線方式與輸出層O5連線。如圖一所示計算公式如下：

ym=S([∑pNXS4p∗WO5pm]+bm)

四、根據圖一而來的誤差反向傳播

訓練時先有網路的輸出結果與輸入圖片的標籤對比，用一個合適的損失函式來度量訓練樣本的輸出損失，接著對這個損失函式進行優化求最小化的極值。損失函式優化極值求解的過程最常見的一般是通過梯度下降法來一步步迭代完成的。計算輸出誤差；得到輸出層O5的誤差，再經神經網路反向傳遞到各層，用於更新權值。用W表示權重，E表示損失函式，n表示第n輪更新迭代，η表示學習引數（可用來控制單次學習速率），u表示啟用函式的輸入，δ表示局域梯度。梯度下降法更新權重更新公式如下，姑且標記一下叫做公式一：

⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪Wn+1=Wn−ΔWnun=Wn⋅Xn+bΔWn=η⋅∂En∂Wn=η⋅∂En∂un⋅∂un∂Wn=η⋅δn⋅Xn

這裡我們採用平方誤差代價函式，誤差能量定義為實際輸出與理想輸出的差，我們討論的多類問題，共c類，N個訓練樣本：

EN=12∑n=1N∑k=1c(tnk−ynk)2

這裡tnk表示第n個樣本對應標籤的第k維。ynk表示第n個樣本對應的網路輸出的第k個輸出。
值得說明的是所有層的δ，無論是單個值矩陣，其資料規模是和對應層的輸出大小相同的。比如O5層有10個，C3層有12*8*8個，S2層有6*24*24個。這一點在之後的計算中你會很容易明白。

4.1、輸出層O5的δ計算

因為在全部訓練集上的誤差只是每個訓練樣本的誤差的總和，所以這裡我們先考慮對於一個樣本的BP。對於第n個樣本的誤差，表示為：

En=12∑k=1c(tn

OpenCL與CNN篇四：CNN從入門到使用

開始

一、神經網路與卷積

二、一個簡單的CNN結構

三、根據圖一而來的正向計算

3.1、卷積層C1、C3的計算

3.2、取樣層S2、S4的計算

3.3、輸出層O5

四、根據圖一而來的誤差反向傳播

4.1、輸出層O5的δ計算

OpenCL與CNN篇四：CNN從入門到使用

OpenCL與CNN篇二：OpenCL基礎API介紹

springAOP源碼分析之篇四：適配器模式

群暉(黑) 篇四：申請免費SSL證書以及用群暉套件搭建郵件服務器（可以收藏的）

JS 基礎篇(四)：JS中的函式

效能調優之MySQL篇四：MySQL配置定位以及優化

Spark效能優化篇四：shuffle調優

SpringMVC4+thymeleaf3的一個簡單例項（篇四：form表單資料驗證）

【基於WPF+OneNote+Oracle的中文圖片識別系統階段總結】之篇四：關於OneNote入庫處理以及稽核

編寫C語言版本的卷積神經網路CNN之二：CNN網路的總體結構

演算法與資料結構+一點點ACM從入門到進階吐血整理推薦書單（珍藏版）

【AC軍團週報（第四周）第一篇】線段樹從入門到入土【4】（未完成）

演算法與資料結構+一點點ACM從入門到進階吐血整理推薦書單pdf附網盤下載連結

gtk學習總結：GTK從入門到放棄，三天包教包會

推薦： Xilinx 工程師實用教程： Vivado 從入門到精通

目標檢測演算法理解：從R-CNN到Mask R-CNN

由淺入深：CNN中卷積層與轉置卷積層的關系

CNN經典模型：GoogLeNet（從Inception v1到v4的演進）

由淺入深：CNN中卷積層與轉置卷積層的關係

【深度學習】8：CNN卷積神經網路與sklearn資料集實現數字識別

OpenCL與CNN篇四：CNN從入門到使用

開始

一、神經網路與卷積

二、一個簡單的CNN結構

三、根據圖一而來的 正向計算

3.1、卷積層C1、C3的計算

3.2、取樣層S2、S4的計算

3.3、輸出層O5

四、根據圖一而來的 誤差反向傳播

4.1、輸出層O5的δ計算

相關推薦

三、根據圖一而來的正向計算

四、根據圖一而來的誤差反向傳播