Machine Learning（五—1）神經網路初步

阿新 • • 發佈：2019-01-24

第四講——Neural Networks 神經網路的表示

===============================

（一）、為什麼引入神經網路？——Nonlinear hypothesis

（二）、神經元與大腦（Neurons and Brain）

（三）、神經網路的表示形式

（四）、怎樣用神經網路實現邏輯表示式？

（五）、分類問題（Classification）

本章主要圍繞神經網路的建模及其線性表示（即neural networks的representation）做以初步瞭解，在下一章中將會有更詳細的神經網路如何學習方面的知識。

===============================

（一）、為什麼引入神經網路？——Nonlinear hypothesis

之前我們討論的ML問題中，主要針對Regression做了分析，其中採用梯度下降法進行引數更新。然而其可行性基於假設引數不多，如果引數多起來了怎麼辦呢？比如下圖中這個例子：從100*100個pixels中選出所有XiXj作為logistic regression的一個引數，那麼總共就有5*10^7個feature，即x有這麼多維。

所以引入了Nonlinear hypothesis，應對高維資料和非線性的hypothesis（如下圖所示）：

===============================

（二）、神經元與大腦（neurons and brain）

神經元工作模式：

神經網路的邏輯單元：輸入向量x（input layer），中間層a(2,i)（hidden layer）, 輸出層h(x)（output layer）。

其中，中間層的a(2,i)中的2表示第二個級別（第一個級別是輸入層），i表示中間層的第幾個元素。或者可以說，a(j,i) is the activation of unit i in layer j.

===============================

（三）、神經網路的表示形式

從圖中可知，中間層a(2，j)是輸入層線性組合的sigmod值，輸出又是中間層線性組合的sigmod值。

下面我們進行神經網路引數計算的向量化：

令z⁽²⁾表示中間層，x表示輸入層，則有

，

z⁽²⁾=Θ⁽¹⁾x

a⁽²⁾=g(z⁽²⁾)

或者可以將x表示成a⁽¹⁾，那麼對於輸入層a⁽¹⁾有[x_0~x_3]4個元素，中間層a⁽²⁾有[a⁽²⁾₀~a⁽²⁾₃]4個元素（其中令a⁽²⁾₀=1），則有

h(x)= a⁽³⁾=g(z⁽³⁾)

z⁽³⁾=Θ⁽²⁾a⁽²⁾

通過以上這種神經元的傳遞方式（input->activation->output）來計算h(x), 叫做Forward propagation, 向前傳遞。

這裡我們可以發現，其實神經網路就像是logistic regression，只不過我們把logistic regression中的輸入向量[x₁~x₃]變成了中間層的[a⁽²⁾₁~a⁽²⁾₃], 即

h(x)=g(Θ⁽²⁾₀ a⁽²⁾₀+Θ⁽²⁾₁ a⁽²⁾₁+Θ⁽²⁾₂ a⁽²⁾₂+Θ⁽²⁾₃ a⁽²⁾₃)

而中間層又由真正的輸入向量通過Θ⁽¹⁾學習而來，這裡呢，就解放了輸入層，換言之輸入層可以是original input data的任何線性組合甚至是多項式組合如set x1*x2 as original x1...另外呢，具體怎樣利用中間層進行更新下面會更詳細地講；此外，還有一些其他模型，比如：

===============================

（四）、怎樣用神經網路實現邏輯表示式？

神經網路中，單層神經元（無中間層）的計算可用來表示邏輯運算，比如邏輯AND、邏輯或OR

舉例說明：邏輯與AND；下圖中左半部分是神經網路的設計與output層表示式，右邊上部分是sigmod函式，下半部分是真值表。

給定神經網路的權值就可以根據真值表判斷該函式的作用。再給出一個邏輯或的例子，如下圖所示：

以上兩個例子只是單層傳遞，下面我們再給出一個更復雜的例子，用來實現邏輯表達< x1 XNOR x2 >, 即邏輯同或關係，它由前面幾個例子共同實現：

將AND、NOT AND和 OR分別放在下圖中輸入層和輸出層的位置，即可得到x1 XNOR x2，道理顯而易見：

a²₁ = x1 && x2

a²₂ = （﹁x1）&&（﹁x2）

a³₁ =a²₁||a²₁ =(x1 && x2) || （﹁x1）&&（﹁x2） = x1 XNOR x2；

應用：手寫識別系統

===============================

（五）、分類問題（Classification）

記得上一章中我們講過的one-vs-all分類問題麼？one-vs-all方法是把二類分類問題到多類分類的一個推廣，在這裡，我們就講述如何用神經網路進行分類。網路設計如下圖所示：

輸入向量x有三個維度，兩個中間層，輸出層4個神經元分別用來表示4類，也就是每一個數據在輸出層都會出現[a b c d]^T，且a,b,c,d中僅有一個為1，表示當前類。

Machine Learning（五—1）神經網路初步

第四講——Neural Networks 神經網路的表示 =============================== （一）、為什麼引入神經網路？——Nonlinear hypothesis （二）、神經元與大腦（Neurons and Brain）（三）、

Note——Neural Network and Deep Learning （1）[神經網路與深度學習學習筆記（1）]

一、初學神經網路的體會正如書中作者說的神經網路可以被稱作最美的程式設計正規化之一，神經網路將我們需要解決的複雜問題，比如手寫字型分類，簡化成一個個簡單的步驟，而本人無需瞭解內部的具體結構引數變化等。關於神經網路已經有很多實用的庫，使用這些庫可以很快的解決問題。但是不滿

吳恩達Coursera深度學習課程筆記（1-1）神經網路和深度學習-深度學習概論

這系列文章是我在學習吳恩達教授深度學習課程時為了加深自己理解，同時方便後來對內容進行回顧而做的筆記，其中難免有錯誤的理解和不太好的表述方式，歡迎各位大佬指正並提供建議。1、什麼是神經網路在簡單的從房屋面積預測價格時，神經網路可以理解為將輸入的房屋

TensorFlow 深度學習框架（1）-- 神經網路與前向傳播

基本概念：計算圖，張量，會話計算圖是相互運算不影響的兩個計算模型，是定義計算的執行，且互不影響#在TensorFlow程式中，系統會自動維護一個預設的計算圖，也支援通過tf.Graph 生成新的計算圖 #不同計算圖上的張量和運算都不會共享 import tensorflow

Machine Learning（機械學習）

前言動手寫這個是為了記錄下自己在學習machine lerning的整個過程，為了更好的回顧和志同道合者一起討論學習進步。我是一邊跟著在coursera上觀看machine learning課程，一邊學習並記錄。這個基本上是每學完一

Machine Learning（機器學習）之三

Machine Learning（機器學習）之二：juejin.im/post/5bd1d1… 分類問題要嘗試分類，一種方法是使用線性迴歸並將大於0.5的所有預測對映為1，將所有小於0.5的預測對映為0.但是，此方法不能很好地工作，因為分類實際上不是線性函式。分類問題就像迴歸問題一

[AI開發]零數學公式告訴你什麼是（卷積）神經網路

大部分介紹神經網路的文章中概念性的東西太多，而且夾雜著很多數學公式，讀起來讓人頭疼，尤其沒什麼基礎的人完全get不到作者想要表達的思想。本篇文章嘗試零公式（但有少量數學知識）說清楚什麼是神經網路，並且舉例來說明神經網路能幹什麼。另外一些文章喜歡舉“根據歷史交易資料預測房子價值”或者&l

五、改進神經網路的學習方法（1）：交叉熵代價函式

本部落格主要內容為圖書《神經網路與深度學習》和National Taiwan University (NTU)林軒田老師的《Machine Learning》的學習筆記，因此在全文中對它們多次引用。初出茅廬，學藝不精，有不足之處還望大家不吝賜教。

周志華《Machine Learning》學習筆記（6）--神經網路

上篇主要討論了決策樹演算法。首先從決策樹的基本概念出發，引出決策樹基於樹形結構進行決策，進一步介紹了構造決策樹的遞迴流程以及其遞迴終止條件，在遞迴的過程中，劃分屬性的選擇起到了關鍵作用，因此緊接著討論了三種評估屬性劃分效果的經典演算法，介紹了剪枝策略來解決原生決

DeepLearning.ai作業:(5-1)-- 迴圈神經網路（Recurrent Neural Networks）（1）

title: ‘DeepLearning.ai作業:(5-1)-- 迴圈神經網路（Recurrent Neural Networks）（1）’ id: dl-ai-5-1h1 tags: dl.ai homework categories: AI Deep

DeepLearning.ai筆記:(5-1)-- 迴圈神經網路（Recurrent Neural Networks）

title: ‘DeepLearning.ai筆記:(5-1)-- 迴圈神經網路（Recurrent Neural Networks）’ id: dl-ai-5-1 tags: dl.ai categories: AI Deep Learning date: 2

DeepLearning.ai作業:(5-1)-- 迴圈神經網路（Recurrent Neural Networks）（2）

title: ‘DeepLearning.ai作業:(5-1)-- 迴圈神經網路（Recurrent Neural Networks）（2）’ id: dl-ai-5-1h2 tags: dl.ai homework categories: AI Deep

DeepLearning.ai作業:(5-1)-- 迴圈神經網路（Recurrent Neural Networks）（3）

title: ‘DeepLearning.ai作業:(5-1)-- 迴圈神經網路（Recurrent Neural Networks）（3）’ id: dl-ai-5-1h3 tags: dl.ai homework categories: AI Deep

機器學習筆記（十五）：TensorFlow實戰七（經典卷積神經網路：VGG）

1 - 引言之前我們介紹了LeNet-5和AlexNet，在AlexNet發明之後，卷積神經網路的層數開始越來越複雜，VGG-16就是一個相對前面2個經典卷積神經網路模型層數明顯更多了。 VGGNet是牛津大學計算機視覺組（Visual Geometry Group）和Google

機器學習筆記（十三）：TensorFlow實戰五（經典卷積神經網路： LeNet -5 ）

1 - 引言之前我們介紹了一下卷積神經網路的基本結構——卷積層和池化層。通過這兩個結構我們可以任意的構建各種各樣的卷積神經網路模型，不同結構的網路模型也有不同的效果。但是怎樣的神經網路模型具有比較好的效果呢？下圖展示了CNN的發展歷程。經過人們不斷的嘗試，誕生了許多有

# [cs231n （六）神經網路 part 2:傳入資料和損失 ][1]

標籤（空格分隔）：神經網路 0.回顧 cs231n （一）影象分類識別講了KNN cs231n （二）講了線性分類器：SVM和SoftMax cs231n （三）優化問題及方法 cs231n （四）反向傳播 cs231n （五）神經網路（part 1）

# [cs231n （八）神經網路總結：最小網路案例研究 ][1]

標籤（空格分隔）：神經網路 0.回顧 cs231n （一）影象分類識別講了KNN cs231n （二）講了線性分類器：SVM和SoftMax cs231n （三）優化問題及方法 cs231n （四）反向傳播 cs231n （五）神經網路 part 1:

# [cs231n （七）神經網路 part 3 : 學習和評估 ][1]

標籤（空格分隔）：神經網路 0.回顧 cs231n （一）影象分類識別講了KNN cs231n （二）講了線性分類器：SVM和SoftMax cs231n （三）優化問題及方法 cs231n （四）反向傳播 cs231n （五）神經網路 part 1:

從0到1：神經網路實現影象識別（中）

”. . . we may have knowledge of the past and cannot control it; we may control the future but have no knowledge of it.” — Claude Shannon 1959

從0到1：神經網路實現影象識別（上）

紙上得來終覺淺，絕知此事要躬行。 “神經網路”是“機器學習”的利器之一，常用演算法在TensorFlow、MXNet計算框架上，有很好的支援。為了更好的理解與使用這件利器，我們可以不借助計算框架，從零開始，一步步構建模型，實現學習演算法，並在一個影象識別資料集上，訓練這個模型，再驗證模型預