機器學習筆記（參考吳恩達機器學習視訊筆記）08_神經網路的學習

阿新 • • 發佈：2018-11-12

8 神經網路的學習

8.1 神經網路的代價函式

神經網路的訓練樣本有m個，每個包含一組輸入x和一組輸出訊號y，L表示神經網路層數，表示每層的neuron個數（表示輸出層神經元個數），代表最後一層中處理單元的個數。

將神經網路的分類定義為兩種情況：二類分類和多類分類。

二類分類：=0，y=0 or 1表示哪一類；

K類分類：=k，=1表示分到第i類；（k>2）

在邏輯迴歸中，只有一個輸出變數，又稱標量（ scalar），也只有一個因變數y。代價函式如下：

但是在神經網路中，可以有很多輸出變數，是一個維度為K的向量，並且訓練集中的因變數也是同樣維度的一個向量，因此神經網路的代價函式比邏輯迴歸更加複雜，具體表達式如下：

對於每一行特徵，都會有K個預測，利用迴圈，對每一行特徵都預測K個不同結果，然後再利用迴圈在K個預測中選擇可能性最高的一個，將其與y中的實際資料進行比較。正則化的那一項是排除了每一層後，每一層的矩陣的和。最裡層的迴圈迴圈所有的行（由+1層的啟用單元數決定）；迴圈i則迴圈所有的列，由該層（層）的啟用單元數決定。即：與真實值之間的距離為每個樣本-每個類輸出的加和，對引數進行正則化的bias項處理所有引數的平方和。

8.2 反向傳播演算法

為了計算代價函式的偏導數，採用一種反向傳播演算法。首先計算最後一層的誤差，然後再一層一層反向求出各層的誤差，直到倒數第二層。以一個例子加以說明：

假設只有一個例項（，），神經網路是一個四層的神經網路，其中K=4，=4，L=4。前向傳播演算法如下：

從最後一層誤差開始計算，誤差是啟用單元的預測（）與實際值（）之間的誤差（k = 1:k），用來表示誤差，則：

其中，，是權重導致的誤差的和，同理可得。第一層不存在誤差，假設，即不做任何正則化處理時，代價函式的偏導數表示為：

代表目前所計算的是第幾層。代表目前計算層中的啟用單元的下標，也將是下一層的第個輸入變數的下標。代表下一層中誤差單元的下標，是受到權重矩陣中第行影響的下一層中的誤差單元的下標。為整個訓練集計算誤差單元，此時的誤差單元也是一個矩陣，用

來表示這個誤差矩陣。第層的第

個啟用單元受到第

個引數影響而導致的誤差。演算法表示為：

for i=l:m{

set

perform forward propagation to compute for

Using

perform back propagation to compute all previous layer error vector

}

首先用正向傳播方法計算出每一層的啟用單元，利用訓練集的結果與神經網路預測的結果求出最後一層的誤差，然後利用該誤差運用反向傳播法計算出直至第二層的所有誤差。則代價函式的偏導數的計算方法如下：

使用神經網路的步驟：

引數的隨機初始化
利用正向傳播方法計算所有的
編寫計算代價函式J的程式碼
利用反向傳播方法計算所有的偏導數
利用數值檢驗方法檢驗這些偏導數
使用優化演算法來最小化代價函式

機器學習筆記（參考吳恩達機器學習視訊筆記）16_決策樹

16 決策樹決策樹是一種監督學習演算法，以樹狀圖為基礎，其輸出結果為一系列簡單實用的規則。它就是一系列的if-then語句，既可以用於分類問題，也可以用於迴歸問題。構建決策樹之通常包括三個步驟： 1）特徵選擇 &n

機器學習筆記（參考吳恩達機器學習視訊筆記）15_推薦系統

15 推薦系統一個電影提供商，有5部電影和4個使用者。要求使用者為電影打分：前三部為愛情片，後兩部為動作片。Alice、Bob更傾向於愛情片，Carol、Dave更傾向於動作片。沒有一個使用者給所有的電影打過分。希望構建一個演算法來預測他們每個人可能會給他們每個人可能會給他們沒

機器學習筆記（參考吳恩達機器學習視訊筆記）14_異常檢測

14 異常檢測異常檢測（Anomaly detection）是機器學習演算法的一個常見應用。這種演算法的一個有趣之處在於：它雖然主要用於非監督學習問題，但從某些角度看，它又類似於一些監督學習問題。異常檢測主要用來識別欺騙。例如線上採集而來的有關使用者的資料，一個特徵向量中可能會包含如

機器學習筆記（參考吳恩達機器學習視訊筆記）13_降維

13 降維 13.1 動機一：資料壓縮假設兩個未知的特徵：是用釐米表示長度；是用英寸表示同一物體的長度。這是一種高度冗餘的表示。希望將這個二維的資料降至一維，即資料壓縮。 13.2 動機二：資料視覺化化降維可以使資料視覺化。關於許多不同國家的資料，每一個特徵向量都有50

機器學習筆記（參考吳恩達機器學習視訊筆記）12_聚類

12 聚類監督學習中，訓練集帶有標籤，目標是找到能夠區分正負樣本的決策邊界，需要根據標籤擬合一個假設函式。非監督學習中，需要將無標籤的訓練資料輸入到一個演算法，此演算法可以找到這些資料的內在結構。一個能夠根據資料的內在結構，將它們分成幾個不同的點集（或簇）的演算法，就被稱為聚類演算法。聚類

機器學習筆記（參考吳恩達機器學習視訊筆記）11_支援向量機

11 支援向量機 11.1 支援向量機的優化目標從邏輯迴歸開始展示我們如何一點一點修改來得到本質上的支援向量機。如圖，一個y=1的樣本，希望趨近於1，意味著當趨近於1時，應當遠大於0。一個y=0的樣本，希望趨近於0，意味著當趨近於0時，應當遠小於0。

機器學習筆記（參考吳恩達機器學習視訊筆記）10_機器學習系統的設計

10 機器學習系統的設計 10.1 構建學習演算法的方法以一個垃圾郵件分類器演算法為例。先要做的決定是如何選擇並表達特徵向量x, 可以選擇一個由 100 個最常出現在垃圾郵件中的詞所構成的列表，根據這些詞是否有在郵件中出現，來獲得我們的特徵向量（出現為 1，不出現為 0），尺寸為 10

機器學習筆記（參考吳恩達機器學習視訊筆記）09_應用機器學習的建議

9 應用機器學習的建議機器學習診斷法：是一種測試方法，通過執行這種測試，可以深入瞭解某種演算法到底是否有用。 9.1 評估假設函式通過評估假設函式來，來避免過擬合和欠擬合問題。模型通過訓練集得出引數後，對測試集運用該模型，有兩種方式計算誤差：對於線性迴歸模型，利用測

機器學習筆記（參考吳恩達機器學習視訊筆記）08_神經網路的學習

8 神經網路的學習 8.1 神經網路的代價函式神經網路的訓練樣本有m個，每個包含一組輸入x和一組輸出訊號y，L表示神經網路層數，表示每層的neuron個數（表示輸出層神經元個數），代表最後一層中處理單元的個數。將神經網路的分類定義為兩種情況：二類分類和多類分類。二類分類：=

機器學習筆記（參考吳恩達機器學習視訊筆記）07_神經網路介紹

7 神經網路介紹當特徵太多時，無論是線性迴歸還是邏輯迴歸模型計算的負荷會非常大。這時需要神經網路。神經網路是一種很古老的演算法，它最初產生的目的是製造能模擬大腦的機器。神經網路是計算量有些偏大的演算法。然而大概由於近些年計算機的執行速度變快，才足以真正執行起大規模的神經網路。類似於神

機器學習筆記（參考吳恩達機器學習視訊筆記）06_正則化

6 正則化 6.1 過擬合問題通過學習得到的假設可能能夠非常好地適應訓練集（代價函式可能幾乎為 0），但是可能會不能推廣到新的資料。如何處理過擬合問題： 1）丟棄一些不能幫助我們正確預測的特徵。可以是手工選擇保留哪些特徵，或者使用一些模型選擇的演算法來幫忙（例如 PCA）。 2

機器學習筆記（參考吳恩達機器學習視訊筆記）04_多變數線性迴歸

4 多變數線性迴歸 4.1 多維特徵代表特徵矩陣中第i行的第j個特徵，也就是第i個訓練例項的第j個特徵。支援多變數的假設函式h表示為：，其中，引入。此時模型中的引數是一個n+1維的向量，特徵矩陣X的維度是m*(n+1)。因此公式可以簡化為：。 4.2 多變數梯度下降在多

機器學習筆記（參考吳恩達機器學習視訊筆記）17_貝葉斯分類器

17 貝葉斯分類器貝葉斯分類是一種分類演算法的總稱，這種演算法均以貝葉斯定理為基礎，故統稱為貝葉斯分類。貝葉斯分類器的分類原理是通過某物件的先驗概率，利用貝葉斯公式計算出其後驗概率，即該物件屬於某一類的概率，選擇具有最大後驗概率的類作為該物件所屬的類。 17.1 貝葉斯

吳恩達deeplearning.ai課程《改善深層神經網路：超引數除錯、正則化以及優化》____學習筆記（第一週）

____tz_zs學習筆記第一週深度學習的實用層面（Practical aspects of Deep Learning）我們將學習如何有效運作神經網路（超引數調優、如何構建資料以及如何確保優化演算法快速執行）設定ML應用（Setting up your ML applic

吳恩達機器學習 - 無監督學習——K-means演算法吳恩達機器學習 - 無監督學習——K-means演算法

原吳恩達機器學習 - 無監督學習——K-means演算法 2018年06月25日 12:02:37 離殤灬孤狼閱讀數：181

吳恩達老師的公開課，簡單神經網路的作業總結

定義四個變數 train_set_x shape: (209, 64, 64, 3) train_set_y shape: (1, 209) test_set_x shape: (50, 64, 64, 3) test_set_y shape: (1,

Coursera 深度學習吳恩達 deep learning.ai 筆記整理（3-2）——機器學習策略

新的 bsp 誤差 spa 歸納空間 font 處理整理一、誤差分析定義：有時我們希望算法能夠勝任人類能做的任務，但是當算法還沒達到人類所預期的性能時，人工檢查算法錯誤會讓你知道接下來做什麽，這也就是誤差分析檢查，發現會把夠狗當恒，是否需要做一個項目專門處理狗

吳恩達機器學習筆記（六） —— 支持向量機SVM

次數括號圖片最小我們支持向量機svm UNC 意思 strong 主要內容：一.損失函數二.決策邊界三.Kernel 四.使用SVM 一.損失函數二.決策邊界對於：當C非常大時，括號括起來的部分就接近於0，所以就變成了：

吳恩達機器學習筆記 —— 19 應用舉例：照片OCR（光學字符識別）

參考 https ocr 噪聲也說字符 www. 定位 cnblogs http://www.cnblogs.com/xing901022/p/9374258.html 本章講述的是一個復雜的機器學習系統，通過它可以看到機器學習的系統是如何組裝起來的；另外也說明了一

吳恩達機器學習課程筆記02——處理房價預測問題（梯度下降演算法詳解）

建議記住的實用符號符號含義 m 樣本數目 x 輸入變數 y 輸出變數/目標變數