深度學習與計算機視覺[CS231N] 學習筆記（4.1）：反向傳播（Backpropagation）

阿新 • • 發佈：2019-02-08

在學習深度學習的過程中，我們常用的一種優化引數的方法就是梯度下降法，而一般情況下，我們搭建的神經網路的結構是：輸入→權重矩陣→損失函式。如下圖所示。
這裡寫圖片描述
而在給定輸入的情況下，為了使我們的損失函式值達到最小，我們就需要調節權重矩陣，使之滿足條件，於是，就有了本文現在要介紹的深度學習中的一個核心方法——反向傳播。

光聽名字可能不太好理解，下面我們用一個簡單的例子來講解反向傳播是如何工作的（瞭解高數中求導的鏈式法則有助於理解該方法）。
如下圖所示，首先定義一個簡單的函式，它具有3個自變數x,y,z，接著，定義中間變數q=x+y，然後令q分別對x,y求導，令f分別對z,q求導。而我們的最終目的是要求出f

對x,y,z的導數。有的同學可能會疑惑，為什麼要這麼麻煩，為什麼不能直接求導呢？請注意，這裡我們覺得麻煩是因為當前使用的函式一個十分簡單的形式，因此我們會覺得這種方法顯得繁雜，但當我們遇到的函式形式十分複雜（大多數情況確實如此）時，反向傳播方法可以有效的幫助我們求得所需的導數。
這裡寫圖片描述

要使用反向傳播方法，我們首先獲取一組給定的樣本值，如下圖所示，假設為x=−2,y=5,z=−4，由此我們可以通過計算得出q=3,f=−12。接下來，我們首先求f對自身的導數，等於1（圖中紅色數字為導數值），然後我們再分別求f對q和z的導數，分別等於z和q，即-4和3，接著，再根據鏈式法則求得f對x和y的導數，均為(

−4∗1)。

這裡寫圖片描述
反向傳播的運算流程可以用下面這幅圖來描述，首先是順著綠色的箭頭計算出相應的變數並存儲起來，然後再順著紅色的箭頭算出我們需要的梯度值。

這裡寫圖片描述
為了說明這種方法確實很有用，我們再列舉另一個比較複雜的函式例子。如下圖所示，我們首先給出函式的具體形式，並計算相應的中間變數和結果變數。

這裡寫圖片描述
接著，我們根據反向傳播的規則和鏈式法則求出每一個變數對應的梯度值，具體如下圖所示。

這裡寫圖片描述
從這裡我們可以看出，如果不使用反向傳播方法而直接去計算梯度的話，過程將會變得十分麻煩，更何況實際中我們使用的函式還要更加複雜！

深度學習與計算機視覺[CS231N] 學習筆記（4.1）：反向傳播（Backpropagation）

深度學習與計算機視覺[CS231N] 學習筆記（4.1）：反向傳播（Backpropagation）

斯坦福CS231n深度學習與計算機視覺課程學習筆記（1）——Introduction

# cs231n 深度學習與計算機視覺(資料彙總）--程式碼及說明 python3.x和python2.x的版本（每次更新完成的作業）

【逐夢AI】深度學習與計算機視覺應用實戰課程（BAT工程師主講，無人汽車，機器人，神經網絡）

分享《深度學習與計算機視覺演算法原理框架應用》《大資料架構詳解從資料獲取到深度學習》PDF資料集

分享《深度學習與計算機視覺演算法原理框架應用》PDF《大資料架構詳解從資料獲取到深度學習》PDF +資料集

分享《深度學習與計算機視覺算法原理框架應用》《大數據架構詳解從數據獲取到深度學習》PDF數據集

深度學習與計算機視覺(PB-04)-rank-N準確度

深度學習與計算機視覺(PB-03)-特徵提取

深度學習與計算機視覺(PB-02)-資料增強

深度學習與計算機視覺(PB-09)-使用HDF5儲存大資料集

深度學習與計算機視覺(PB-08)-應用深度學習最佳途徑

深度學習與計算機視覺(PB-10)-Kaggle之貓狗比賽

深度學習與計算機視覺(PB-07)-優化演算法

深度學習與計算機視覺(PB-06)-模型整合

深度學習與計算機視覺(PB-05)-網路微調

深度學習與計算機視覺(PB-12)-ResNet

深度學習與計算機視覺：搞懂反向傳播演算法的四個基本方程

深度學習與計算機視覺：深度學習必知基本概念以及鏈式求導

機器學習與計算機視覺（深度學習）

深度學習與計算機視覺[CS231N] 學習筆記（4.1）：反向傳播（Backpropagation）

相關推薦