【機器學習筆記20】神經網路（鏈式求導和反向傳播)

阿新 • • 發佈：2018-12-12

【參考文獻】【1】《面向機器智慧的TensorFlow實踐》4.7

假設存在網路結果如下

在這裡插入圖片描述

各個層輸出定義

$L_1 = sigmoid(w_1 \cdot x)$ $L_2 = sigmoid(w_2 \cdot L_1)$ $L_3 = sigmoid(w_3 \cdot L_2)$

定義整個網路最終的損失函式為 $loss = Loss(L_3, y_{expect})$

l o s s = L o s s (L_{3}, y_{e x p e c t})

對損失函式求 $w_3$ 偏導數，得到

$\dfrac{\partial loss}{\partial w_3}=Loss'(L_3, y_{expect})sigmoid'(w_3, L_2)L_2$

同理我們得到對 $w_2$ 和 $w_1$ 的偏導數 $\frac{\partial l o s s}{\partial w_{2}} = L o s s^{'} (L_{3}, y_{e x p e c t}) s i g m o i d^{'} ($

w3,L2)sigmoid′(w2,L1)L1\dfrac{\partial loss}{\partial w_2}=Loss'(L_3, y_{expect})sigmoid'(w_3, L_2)sigmoid'(w_2, L_1)L_1

\partial w _{2} \partial l o s s = L o s s^{'} (L_{3}, y_{e x p e c t}) s i g m o i d^{'} (w_{3}, L_{2}) s i g m o i d^{'} (w_{2}, L_{1}) L_{1}

$\dfrac{\partial loss}{\partial w_1}=Loss'(L_3, y_{expect})sigmoid'(w_3, L_2)sigmoid'(w_2, L_1)sigmoid'(w_1, x)x$

\partial w _{1} \partial l o s s = L o s s^{'} (L_{3}, y_{e x p e c t}) s i g m o i d^{'} (w_{3}, L_{2}) s i g m o i d^{'} (w_{2}, L_{1}) s i g m o i d^{'} (w_{1}, x) x

綜上所述，我們將整個求導公式簡寫 $\dfrac{\partial loss}{\partial w_3}=Loss'L_3'L_2$ $\dfrac{\partial loss}{\partial w_2}=Loss'L_3'L_2'L1$ $\dfrac{\partial loss}{\partial w_1}=Loss'L_3'L_2'L1x$

可以看到規律在反向求導中，每一次計算都可以重用前一層的計算結果，這也就是所謂的反向傳播演算法。

【機器學習筆記20】神經網路（鏈式求導和反向傳播)

【機器學習筆記20】神經網路（鏈式求導和反向傳播)

【機器學習筆記21】神經網路（多層感知機)

【機器學習筆記19】神經網路（單層感知機）

【機器學習筆記23】神經網路（RNN)

【機器學習筆記22】神經網路(卷積神經網路)

【機器學習筆記24】神經網路(LSTM)

【機器學習筆記08】分類器（softmax迴歸)

【機器學習筆記12】聚類（k-means)

【機器學習筆記13】聚類（高斯混合聚類）

【深度學習基礎-09】神經網路-機器學習深度學習中~Sigmoid函式詳解

Andrew Ng 機器學習筆記 09 ：神經網路

【機器學習筆記35】蟻群演算法

【深度學習基礎1】神經網路基礎--邏輯迴歸

【機器學習筆記02】最小二乘法（多元線性迴歸模型）

【機器學習筆記01】最小二乘法（一元線性迴歸模型）

【機器學習筆記04】隨機梯度下降

【機器學習筆記05】Jacobian矩陣&Hessian矩陣

【機器學習筆記18】隱馬爾可夫模型

【機器學習筆記14】奇異值分解(SVD)

【機器學習筆記17】支援向量機

【機器學習筆記20】神經網路（鏈式求導和反向傳播)

相關推薦