神經網路中的前向和後向演算法

最近深度學習的研究在學界火的一塌糊塗，大老闆終於也下定決心組織實驗室開展相關研究了，何況實驗室的主流方向是做成像的，不做點這方面的研究感覺說不過去。研究生小朋友們剛進來還得看視覺方面的東西，博三博四的師兄師姐們基本都達到畢業要求了已經無心學習，最後這種為實驗室服務性的工作就丟到了我們博二的頭上。。。
看了一段時間的深度網路模型，也在tf和theano上都跑了一些模型，但是感覺沒有潛下去，對很多東西的理解都只停留在“這個是幹什麼的”層次上面。昨天在和小老師一起看一篇文章的時候，就被問到RNN裡面的後向傳播演算法具體是怎麼推。當時心裡覺得BP演算法其實很熟悉啊，然後在推導的過程中就一臉懵逼了。於是又去網上翻了翻相關內容，自己走了一遍，準備做個筆記，算是個交代。

準備一個神經網路模型，比如：

這裡寫圖片描述

其中，[i1,i2]代表輸入層的兩個結點，[h1,h2]代表隱藏層的兩個結點，[o1,o2]為輸出。[b1,b2]為偏置項。連線每個結點之間的邊已經在圖中標出。

來了解一下前向演算法：

前向演算法的作用是計算輸入層結點對隱藏層結點的影響，也就是說，把網路正向的走一遍：輸入層—->隱藏層—->輸出層
計算每個結點對其下一層結點的影響。
例如，我們要算結點h1的值，那麼就是：

neth1=i1×w1+i2×w2+b1×1是一個簡單的加權求和。這裡稍微說一下，偏置項和權重項的作用是類似的，不同之處在於權重項一般以乘法的形式體現，而偏置項以加法的形式體現。
而在計算結點o

1時，結點h1的輸出不能簡單的使用neth1的結果，必須要計算啟用函式，啟用函式，不是說要去啟用什麼，而是要指“啟用的神經元的特徵”通過函式保留並映射出來。以sigmoid函式為例，h1的輸出：outh1=11+e−neth1
於是neto1=outh1×w5+outh2×w6+b2×1
最後o1的輸出結果，也就是整個網路的一個輸出值是：outo1=11+e−neto1按照上面的步驟計算出out02，則[outo1,outo2] 就是整個網路第一次前向運算之後得到的結果。

後向演算法：

在實際情況中，因為是隨機給定的權值，很大的可能（幾乎是100%）得到的輸出與實際結果之間的偏差非常的大，這個時候我們就需要比較我們的輸出和實際結果之間的差異，將這個殘差返回給整個網路，調整網路中的權重關係。這也是為什麼我們在神經網路中需要後向傳播的原因。其主要計算步驟如下：
1. 計算總誤差

Etotal=∑12(target−output)22. 隱藏層的權值更新
在要更新每個邊的權重之前，必須要知道這條邊對最後輸出結果的影響，可以用整體誤差對w5求偏導求出：∂Etotal∂w5具體計算的時候，可以採用鏈式法則展開：∂Etotal∂outo1×∂outo1∂neto1×

神經網路中的前向和後向演算法

神經網路中的前向和後向演算法

卷積神經網路CNN的前向和後向傳播（一）

卷積神經網路CNN的前向和後向傳播（二）

神經網路中前向傳播和反向傳播解析

迴圈神經網路(RNN)模型與前向反向傳播演算法

Java種子填充演算法四向和八向

python神經網路解決手寫識別問題演算法和程式碼

吳恩達《神經網路與深度學習》課程筆記歸納（三）-- 神經網路基礎之Python與向量化

影象處理八：前向對映和後向對映

雙層神經網路與邏輯迴歸正反向傳播數學公式簡要推導

【神經網路】自編碼聚類演算法--DEC (Deep Embedded Clustering)

誰擋了我的神經網路？（二）—— 優化演算法

機器學習_1.神經網路的研究和學習（一）

深度學習之神經網路（CNN/RNN/GAN）演算法原理+實戰目前最新

神經網路學習(一)——感知器分類演算法

卷積神經網路--人臉識別和神經風格遷移

深度學習之PyTorch實戰（2）——神經網路模型搭建和引數優化

[純C#實現]基於BP神經網路的中文手寫識別演算法

神經網路梯度消失和梯度爆炸及解決辦法

機器學習-實現簡單神經網路（筆記和程式碼實現）

神經網路中的前向和後向演算法

相關推薦