深層神經網路（Deep L-layer neural network）--（前向傳播和反向傳播（Forward and backward propagation））

阿新 • • 發佈：2021-07-25

1 深層神經網路

1.1 深層神經網路（Deep L-layer neural network）

嚴格上來說邏輯迴歸也是一個一層的神經網路，有一個隱藏層的神經網路，就是一個兩層神經網路，當我們算神經網路的層數時，我們不算輸入層，我們只算隱藏層和輸出層。

上圖是一個四層的神經網路，有三個隱藏層，我們可以看到，第一層（即左邊數過去第二層，因為輸入層是第 0 層）有 5 個神經元數目，第二層 5 個，第三層 3 個。我們用 L 表示層數，上圖：L= 4，輸入層的索引為“0”，第一個隱藏層n^[1]= 5,表示有 5個隱藏神經元，同理n^[2]= 5，n^[3]= 3，n^[4]=n^[^L^]= 1（輸出單元為

1）,而輸入層，n[0] =n_x= 3。在不同層所擁有的神經元的數目，對於每層 l 都用a^[^l^]來記作 l 層啟用後結果，我們會在後面看到在正向傳播時，最終能你會計算出a^[^l^]。通過用啟用函式 g計算z^[^l^]，啟用函式也被索引為層數l，然後我們用w^[^l^]來記作在 l 層計算z^[^l^]值的權重。類似的，z^[^l^]裡的方程b^[^l^]也一樣。輸入的特徵記作x，但是x同樣也是 0 層的啟用函式，所以x= a^[0]，最後一層的啟用函式，所以a^[^L^]是等於這個神經網路所預測的輸出結果。

1.2 前向傳播和反向傳播（Forward and backward propagation）

前向傳播，輸入a^[^l^−1]，輸出是a

^[^l^]，快取為z^[^l^]；從實現的角度來說我們可以快取下w^[^l^]和b^[^l^]，這樣更容易在不同的環節中呼叫函式。

前向傳播的步驟可以寫成：

向量化實現過程可以寫成：

前向傳播需要喂入A[0]也就是X，來初始化；初始化的是第一層的輸入值,a[0]對應於一個訓練樣本的輸入特徵，而A[0]對應於一整個訓練樣本的輸入特徵，所以這就是這條鏈的第一個前向函式的輸入，重複這個步驟就可以從左到右計算前向傳播。

反向傳播的步驟：輸入為da^[l]，輸出為da^[l−1]，dw^[l], db^[l]

反向傳播的步驟可以寫成：

向量化實現過程可以寫成：

1.3 深層網路中的前向傳播（Forward propagation in a Deep Network

）

前向傳播可以歸納為多次迭代：

向量化實現過程可以寫成：

1.4 核對矩陣的維數（Getting your matrix dimensions right）

w的維度是（下一層的維數，前一層的維數）:

b的維度是（下一層的維數，1）:

dw[l]和w[l]維度相同，db[l]和b[l]維度相同，且w和b向量化維度不變，但z,a以及x的維度會向量化後發生變化。

向量化後：Z^[^l^]可以看成由每一個單獨的Z^[^l^]疊加而得到，Z^[^l^]= (z^[^l^][1]，z^[^l^][2]，z^[^l^][3]，…，z^[^l^][^m^])，m為訓練集大小，所以Z^[^l^]的維度不再是(n^[^l^], 1)，而是(n^[^l^], m)。

A^[^l^]：(n^[^l^], m)，A^[0]= X= (n^[^l^], m)

1.5 為什麼使用深層表示？（Why deep representations?）

如果你在建一個人臉識別或是人臉檢測系統，深度神經網路所做的事就是，當你輸入一張臉部的照片，然後你可以把深度神經網路的第一層，當成一個特徵探測器或者邊緣探測器,隱藏單元就是這些圖裡這些小方塊,可以先把神經網路的第一層當作看圖，然後去找這張照片的各個邊緣。我們可以把照片裡組成邊緣的畫素們放在一起看，然後它可以把被探測到的邊緣組合成面部的不同部分,比如說，可能有一個神經元會去找眼睛的部分，另外還有別的在找鼻子的部分，然後把這許多的邊緣結合在一起，就可以開始檢測人臉的不同部分。所以深度神經網路的這許多隱藏層中，較早的前幾層能學習一些低層次的簡單特徵，等到後幾層，就能把簡單的特徵結合起來，去探測更加複雜的東西。

本文來自部落格園，作者：zhang-X，轉載請註明原文連結：https://www.cnblogs.com/YY-zhang/p/15057987.html

深層神經網路（Deep L-layer neural network）--（前向傳播和反向傳播（Forward and backward propagation））

深層神經網路（Deep L-layer neural network）--（前向傳播和反向傳播（Forward and backward propagation））

Neural Network 學習2 前向傳播實戰

Ng深度學習改善深層神經網路

Ng深度學習筆記改善深層神經網路優化演算法

通過深層神經網路生成音樂

吳恩達深度學習課件_吳恩達深度學習筆記02.改善深層神經網路 W3.超引數除錯、Batch Norm和程式框架...

深層神經網路

深度學習基礎-基於Numpy的多層前饋神經網路（FFN）的構建和反向傳播訓練

《神經網路的梯度推導與程式碼驗證》之CNN前向和反向傳播過程的程式碼驗證

論文解讀丨圖神經網路應用於半結構化文件的命名實體識別和關係提取

零基礎入門深度學習 | 第三章：神經網路和反向傳播演算法

js正則表示式中的正向肯定預查和正向否定預查，反向肯定和反向否定（這個翻譯不準確）

應用程式無法正常啟動(0x000007b)或者找不到dll檔案（以vcruntime140d.dll為例）的原因原理分析和解決方法（親測已解決）

力扣刷題筆記：441.排列硬幣（二分查詢模板題，等差數列求前n項和，程式碼很好理解）

深度學習——前向傳播演算法和反向傳播演算法（BP演算法）及其推導

ROS2學習之旅（15）——編寫簡單的服務和客戶節點（C++）

Deep neural networks using a single neuron（使用單個神經元的深度神經網路）

cs224w 圖神經網路學習筆記（九）Graph Neural Networks 圖神經網路

如何用Python 實現全連線神經網路（Multi-layer Perceptron）

TensorFlow 堆疊迴圈神經網路（深層迴圈神經網路）

深層神經網路（Deep L-layer neural network）--（前向傳播和反向傳播（Forward and backward propagation））

相關推薦