1. 程式人生 > 實用技巧 >深度學習2.0-16.隨機梯度下降之反向傳播演算法推導

深度學習2.0-16.隨機梯度下降之反向傳播演算法推導

文章目錄

1.啟用函式及其梯度

在這裡插入圖片描述

1.sigmoid/Logistic

在這裡插入圖片描述
在這裡插入圖片描述
容易出現梯度離散,權值長時間保持不變,未能更新
在這裡插入圖片描述

2.Tanh-在RNN中使用較多

在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述

3.relu-Rectified Linear Unit(整型的線性單元)

在這裡插入圖片描述
在這裡插入圖片描述

2.損失函式及其梯度

在這裡插入圖片描述

1.MSE-Mean Squared Error

在這裡插入圖片描述
在這裡插入圖片描述

2.Cross Entropy Loss

在這裡插入圖片描述
在這裡插入圖片描述

softmax

在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述

3.單輸出感知機及其梯度

在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述

4.多輸出感知機以及梯度

在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述

5.鏈式法則

在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述

6.多層感知機梯度(反向傳播演算法)

在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述