基本原理
BP演算法演算法
- cost function
- 求引數
- BP演算法推導
參考資料

　　前面簡單的認識了一下神經網路，這裡我要與大家分享的是神經網路中的大明星：BP演算法。下面的內容主要是來自斯坦福大學的教程，這篇教程是我看過的所有BP相關教程中最好的，其中補充了一些內容。
　　BP（Back Propagation）神經網路是1986年由Rumelhart和McCelland為首的科學家小組提出，是一種按誤差逆傳播演算法訓練的多層前饋網路，是目前應用最廣泛的神經網路模型之一。BP網路能學習和存貯大量的輸入-輸出模式對映關係，而無需事前揭示描述這種對映關係的數學方程。它的學習規則是使用梯度下降法，通過反向傳播來不斷調整網路的權值和閾值，使網路的誤差平方和最小。BP神經網路模型拓撲結構包括輸入層（input）、隱層(hidden layer)和輸出層(output layer)。

基本原理

　　BP演算法基本原理是利用輸出後的誤差來估計輸出層的直接前導層的誤差，再用這個誤差估計更前一層的誤差，如此一層一層的反傳下去，就獲得了所有其他各層的誤差估計。看下面幾個動圖：
這裡寫圖片描述

如上面動圖展示，誤差就這樣通過一層一層的傳播，最後根據誤差使用梯度下降法更新每個節點的引數。

BP演算法1

Cost Function

　　一個固定樣本集 {(x(1),y(1)),…,(x(m),y(m))}，它包含 m 個樣例。我們可以用批量梯度下降法來求解神經網路。具體來講，對於單個樣例(x,y)，其代價函式為：

J(W,b;x,y)=12∥∥hW,b(x)−y∥

∥2.
　　這是一個（二分之一的）方差代價函式。給定一個包含 m 個樣例的資料集，我們可以定義整體代價函式為： J(W,b)=[1m∑i=1mJ(W,b;x(i),y(i))]+λ2∑l=1nl−1∑i=1sl∑j=1sl+1(W(l)ji)2=[1m∑i=1m(12∥∥hW,b(x(i))−y(i)∥∥2)]+λ2∑l=1nl−1∑i=1sl∑j=1sl+1(W(l)ji)2
　　以上公式中的第一項 J(W,b) 是一個均方差項。第二項是一個規則化項（也叫權重衰減項），其目的是減小權重的幅度，防止過度擬合。

[注：通常權重衰減的計算並不使用偏置項 b(l)i，比如我們在 J(W,

b)的定義中就沒有使用。一般來說，將偏置項包含在權重衰減項中只會對最終的神經網路產生很小的影響。如果你在斯坦福選修過CS229（機器學習）課程，或者在YouTube上看過課程視訊，你會發現這個權重衰減實際上是課上提到的貝葉斯規則化方法的變種。在貝葉斯規則化方法中，我們將高斯先驗概率引入到引數中計算MAP（極大後驗）估計（而不是極大似然估計）。]

　　權重衰減引數 λ 用於控制公式中兩項的相對重要性。在此重申一下這兩個複雜函式的含義：J(W,b;x,y) 是針對單個樣例計算得到的方差代價函式；J(W,b) 是整體樣本代價函式，它包含權重衰減項。

　　以上的代價函式經常被用於分類和迴歸問題。在分類問題中，我們用 y=0或 1，來代表兩種型別的標籤（回想一下，這是因為 sigmoid啟用函式的值域為 [0,1]；如果我們使用雙曲正切型啟用函式，那麼應該選用−1和 +1作為標籤）。對於迴歸問題，我們首先要變換輸出值域（譯者注：也就是 y），以保證其範圍為 [0,1]（同樣地，如果我們使用雙曲正切型啟用函式，要使輸出值域為 [−1,1]）。

求參

　　我們的目標是針對引數 W和 b來求其函式

DeepLearning:四、BP神經網路

基本原理

BP演算法1

Cost Function

求參

DeepLearning:四、BP神經網路

基於BP神經網路的數字識別基礎系統（四）

機器學習與神經網路（四）：BP神經網路的介紹和Python程式碼實現

機器學習（四）：BP神經網路_手寫數字識別_Python

西瓜書5.5 程式設計實現BP神經網路——標準BP演算法、累積BP演算法

BP神經網路基於Tensorflow的實現（程式碼註釋詳細）

Tensorflow系列專題（四）：神經網路篇之前饋神經網路綜述

從神經元到CNN、RNN、GAN…神經網路看本文絕對夠了

BP神經網路如何進行權值的初始化

遺傳演算法+BP神經網路組合求解非線性函式

BP神經網路說明及推導

神經網路學習（3）————BP神經網路以及python實現

機器學習與深度學習系列連載：第二部分深度學習（十四）迴圈神經網路 2（Gated RNN - LSTM ）

BP神經網路演算法的理解

單隱層BP神經網路C++實現

Tensorflow: MNIST資料集實現DNN、CNN、LSTM神經網路

Tensorflow學習筆記(四)——簡單的神經網路實現

神經網路學習(三)——BP神經網路演算法

Tensorflow實現BP神經網路

基於PCA與BP神經網路的人臉識別

DeepLearning:四、BP神經網路

基本原理

BP演算法1

Cost Function

求參

相關推薦