【李巨集毅ML筆記】 11 BP反向傳播

阿新 • • 發佈：2019-02-10

梯度提升在神經網路訓練中的過程

：

實際，BackPropagation是一種比較有效率計算的Gradient Descent方法

記住BackPropagation中的鏈式法則Chain Rule如下：

以上，即多元複合函式的求導公式，如下：

如下，在Neuron Network的training中，

yn 與 yn^的距離，即（偏差）距離值定義為Cn。

累加所有的Neuron的（偏差）距離值，得到整個Network的total loass損失值L(θ)。

用該累加公式對w求導。該公式意義在與，求L(θ)對w的偏微分，可以轉換為求每個Neuron對w的求導的累加和。

如下，以第一個Neuron為例，則x1，x2位原始輸入向量，進行計算。

由計算損失函式對w的偏導，基於鏈式法則，改為求函式模型對w的偏導*損失函式對啟用函式模型的偏導

如下，第一步，計算φ(z)/φ(w)，規律就是wi前接的input是xi，則其偏微分為xi。

舉例如下，計算z，然後使用activation function（這裡用的sigmoid function），計算得到輸出0.98。

第一步，計算φ(C)/φ(z)，C是在計算得到z，再經過activation function得到yn^，最後還要經過loss function，得到了C的值。因此，φ(C)/φ(z)很複雜。

假設a = σ(z)， σ為sigmoid函式，然後a再與w3/w4得到z'/z''，以及後續的a',a''

ruxia因為a結合w3,w4分別影響後續的z'和z''，基於鏈式法則，假設後一層只有兩個neuron，也可以有1000個，下面式子更長。

然後，求φ(z')/φ(a)也很簡單了，跟前面的φ(z)/φ(w)類似，偏微分就是前面的wi，其餘部分φ(C)/φ(z')假設已經算出（後面考慮）。

即可得到下式：

反過來，從右往左看，假設有一個新的neuron，且不在原先的Network中，所做的工作跟上面中等式中括號中一樣，再直接乘以在forward pass中得到的已知的φ(z')。樣子如下，其input是φ(C)/φ(z')，φ(C)/φ(z'')，得到的結果就是φ(C)/φ(z)，z是固定的值，則φ(z)是常數。形成了backward pass

如下：假設能算φ(z')，φ(z'')，則問題就都能解決了，假設已經處於最後一層neuron，輸出為y1,y2...可加入y1,y2，並利用鏈式法則，基於假設的C誤差函式，求出φ(C)/φ(z')，φ(C)/φ(z'')，進而求出φ(C)/φ(z)。如果只有兩層，那按下面方法，就可以求出w1，w2了。

然而，如下，假設第一層後沒有輸出層，接的是下一個隱層，一樣原理。

換一個方向，從y1，y2輸出層開始，反向算，運算量跟forword pass是一樣的，只是用了很多鏈式法則。

如下，想要計算z1對C的偏微分，則算z3、z4根C的偏微分，想知道z3的偏微分，需要知道z5，z6對C的偏微分。

反之，就都算出來了。如果先算z5，z6對C的偏微分，再算z3、z4的偏微分，往前算。

那麼，怎麼先算z5，z6呢？利用假設一個反向的Neuron network，層層計算，做backward pass如下：

總結：

先做一個forward pass，知道activation function的output，就是φ(z)/φ(w)=a,在backward pass中，求φ(C)/φ(z)，相乘，得到φ(C)/φ(w)

【李巨集毅ML筆記】 11 BP反向傳播

【李巨集毅ML筆記】 11 BP反向傳播

【臺大李巨集毅ML課程】Lecture 13 Unsupervised Learning——Linear Dimension Reduction筆記

【李巨集毅深度強化學習2018】P3 Q-learning（Basic Idea）

【李巨集毅深度強化學習2018】P2 Proximal Policy Optimization (PPO)

16、【李巨集毅機器學習（2017）】Unsupervised Learning: Deep Auto-encoder（無監督學習：深度自動編碼器）

【資料探勘學習筆記】11.頻繁模式挖掘進階與關聯規則

【ML】李巨集毅機器學習筆記

【深度學習基礎】《深度學習》李巨集毅

【機器學習（李巨集毅）】三、Bias and Variance

機器學習【吳恩達|周志華|李巨集毅|演算法】清單 #收藏#

李巨集毅《機器學習（2017版）》課程筆記及心得第1篇——Introduction of ML

【視頻編解碼·學習筆記】11. 提取SPS信息程序

【李宏毅深度學習合輯】Advanced Topics in Deep Learning - Imitation Learning

李巨集毅機器學習 P14 Backpropagation 筆記

李巨集毅機器學習 P13 Brief Introduction of Deep Learning 筆記

李巨集毅機器學習 P12 HW2 Winner or Loser 筆記（不使用框架實現使用MBGD優化方法和z_score標準化的logistic regression模型）

李巨集毅機器學習P11 Logistic Regression 筆記

李巨集毅機器學習 P15 “Hello world” of deep learning 筆記

李巨集毅機器學習P7 Gradient Descent (Demo by AOE) 筆記、P8 Gradient Descent (Demo by Minecraft) 筆記

李巨集毅機器學習筆記——02.Where does the error come from ?

【李巨集毅ML筆記】 11 BP反向傳播

相關推薦