神經網路啟用函式學習要點記錄

阿新 • • 發佈：2018-12-14

如下圖所示，在神經元中，輸入通過加權，求和後，還被作用於一個函式，這個函式就是啟用函式/激勵函式 Activation Function。啟用函式的作用是為了增加神經網路的非線性。

常用的啟用函式：

1、Sigmoid函式：

Sigmoid 影象

特點：能夠把輸入的連續實值變換為0和1之間的輸出，特別的，如果是非常大的負數，那麼輸出就是0；如果是非常大的正數，輸出就是1。

缺點：在深度神經網路中梯度反向傳遞時導致梯度爆炸和梯度消失，其中梯度爆炸發生的概率非常小，而梯度消失發生的概率比較大。

解析式中含有冪運算，計算機求解時相對來講比較耗時。對於規模比較大的深度網路，這會較大地增加訓練時間。

其輸出並不是以0為中心的。會導致後一層的神經元將得到上一層輸出的非0均值的訊號作為輸入。產生的一個結果就是：如果資料進入神經元的時候是正的，那麼計算出的梯度也會始終都是正的。

不建議在網路中使用。

2、tanh函式：

Tanh函式影象

它解決了Sigmoid函式的不是zero-centered輸出問題，然而，梯度消失（gradient vanishing）的問題和冪運算的問題仍然存在。

不建議在網路中使用。

3、ReLU函式（Rectified Linear Unit，修正線性單元）：

ReLU函式影象

優點：解決了梯度消失（gradient vanishing）問題 (在正區間)

計算速度非常快，只需要判斷輸入是否大於0

收斂速度遠快於sigmoid和tanh

缺點：隨著訓練的進行，可能會出現神經元死亡、權重無法更新的情況。可以通過設定learning rate來緩解。

4、PReLU（Parametric Rectified Linear Unit）函式：

f(x) = max(ax, x) 一般來說a為很小的係數，在訓練中取一定範圍內的隨機值，在測試時固定。當a=0.01時為Leaky ReLU。

有ReLU函式的優點，解決了神經元死亡的問題。

Softmax 函式：

多用於輸出層，計算分類概率。

結論：

選擇啟用函式時，優先選擇ReLU及其變體，而不是sigmoid或tanh。ReLU及其變體訓練起來更快。如果ReLU導致神經元死亡，使用Leaky ReLU或者ReLU的其他變體。sigmoid和tanh受到消失梯度問題的困擾，不應該在隱藏層中使用。隱藏層使用ReLU及其變體較好。使用容易求導和訓練的啟用函式。

神經網路啟用函式學習要點記錄

如下圖所示，在神經元中，輸入通過加權，求和後，還被作用於一個函式，這個函式就是啟用函式/激勵函式 Activation Function。啟用函式的作用是為了增加神經網路的非線性。常用的啟用函式： 1、Sigmoid函式：特點：能夠把輸入的連續實值變換為0和1之間的輸出，

形象的解釋神經網路啟用函式的作用是什麼

轉載自形象的解釋神經網路啟用函式的作用是什麼神經網路中啟用函式的作用查閱資料和學習，大家對神經網路中啟用函式的作用主要集中下面這個觀點：啟用函式是用來加入非線性因素的，解決性模型所不能解決的問題。下面我分別從這個方面通過例子給出自己的理解~ @le

[形象的解釋神經網路啟用函式的作用是什麼？]

查閱資料和學習，大家對神經網路中啟用函式的作用主要集中下面這個觀點：啟用函式是用來加入非線性因素的，解決線性模型所不能解決的問題。下面我分別從這個方面通過例子給出自己的理解~ @lee philip@顏沁睿倆位的回答已經非常好了，我舉的例子也是來源於他們，在這

神經網路の啟用函式(Activation Function)

日常 coding 中，我們會很自然的使用一些啟用函式，比如：sigmoid、ReLU等等。不過好像忘了問自己一(nn)件事：為什麼需要啟用函式？啟用函式都有哪些？都長什麼樣？有哪些優缺點？怎麼選用啟用函式？本文正是基於這些問題展開的，歡迎批評指正！ (

神經網路啟用函式總結

啟用函式總結 sigmoid tanh ReLU Leaky ReLU Maxout ELU sigmoid 數學表示： y=11+e−x 不建議使用,容易飽和 tanh 數學

機器學習中Logistic損失函式以及神經網路損失函式詳解

機器學習中最重要的三個部分為網路結構、損失函式、優化策略。而其中以損失函式最難以理解，主要原因是需要較強的數學知識，其中用的最多的就是引數估計。所謂引數估計就是：對未知引數θ進行估計時，在引數可能的取值範圍內選取，使“樣本獲得此觀測值”的概率最大的引數作為θ的估計，這樣選定的有利於”

記錄一下最近學的神經網路以及深度學習

人工神經網路是早期機器學習中的一種重要演算法，經歷了數十年的起伏。神經網路的原理受到我們大腦生理結構神經元——的啟發。但與大腦中可以在一定距離內連線的任何神經元不同，人工神經網路具有、連線和資料傳播方向的離散層。例如，我們可以將影象分割成影象塊並將它們輸入到神經網路的

【theano-windows】學習筆記十一——theano中與神經網路相關函式

前言經過softmax和MLP的學習, 我們發現thenao.tensor中除了之前的部落格【theano-windows】學習筆記五——theano中張量部分函式提到的張量的定義和基本運算外, 還有一個方法稱為nnet, 如果自己實現過前面兩篇部落格中的程

神經網路與深度學習課程筆記（第三、四周）

接著學習吳恩達老師第三、四周的課程。（圖片均來自吳恩達老師課件）第三週 1. 普通的淺層網路

神經網路與深度學習課程筆記（第一、二週）

之前結束了吳恩達老師的機器學習的15節課，雖然看得很艱辛，但是也算是對於機器學習的理論有了一個入門，很多的東西需要不斷的思考以及總結。現在開始深度學習的學習，仍然做課程筆記，記錄自己的一些收穫以及思考。第一週 1. ReLU （Rectified

人工智慧，機器學習，神經網路，深度學習的關係

目錄機器學習有監督學習和無監督學習神經網路剛剛接觸人工智慧的內容時，經常性的會看到人工智慧，機器學習，深度學習還有神經網路的不同的術語，一個個都很高冷，以致於傻傻分不清到底它們之間是什麼樣的關係，很多時候都認為是一個東西的不同表達而已，看了一些具體的介紹後才漸漸有了一個大

深度學習介紹（下）【Coursera deeplearning.ai 神經網路與深度學習】

1. shallow NN 淺層神經網路 2. 為什麼需要activation function？如下圖所示，如果不用啟用函式，那麼我們一直都在做線性運算，對於複雜問題沒有意義。linear 其實也算一類啟用函式，但是一般只用在機器學習的迴歸問題，例如預測房價等。 3.

分享《神經網路與深度學習（美）Michael Nielsen 著》中文版PDF+英文版PDF+原始碼

下載：https://pan.baidu.com/s/18_Y7fJMaKwFRKKuGjYIreg 更多資料分享：http://blog.51cto.com/3215120 《神經網路與深度學習（美）Michael Nielsen 著》中文版PDF+英文版PDF+原始碼中文版PDF，206頁，帶書籤目錄

深度學習筆記（四）——神經網路和深度學習（淺層神經網路）

1.神經網路概覽神經網路的結構與邏輯迴歸類似，只是神經網路的層數比邏輯迴歸多一層，多出來的中間那層稱為隱藏層或中間層。從計算上來說，神經網路的正向傳播和反向傳播過程只是比邏輯迴歸多了一次重複的計算。正向傳播過程分成兩層，第一層是輸入層到隱藏層，用上標[1]來表示；第二層是隱藏層到輸出層，用上標

吳恩達第一門-神經網路和深度學習第二週6-10學習筆記

神經網路和深度學習第二週6-10學習筆記 6.更多導數的例子在本節中，為上一節的導數學習提供更多的例子。在上一節中，我們複習了線性函式的求導方法，其導數值在各點中是相等的。本節以y=a^2這一二次函式為例，介紹了導數值在各點處發生變化時的求導方法。求導大家都會，y=x ^3的導數是

deeplearning.ai神經網路與深度學習第一章notes

神經網路與深度學習第一章目錄什麼是神經網路用神經網路進行監督學習為什麼深度學習會興起什麼是神經網路 1.1定義它是一個源於人腦工作機理的強大演算法 1.2單元神經網路　　我們首先看一個例子，這個例子是一個房價評估問題。我們現在有一些資料，是房子的

26種神經網路啟用視覺化

在網上發現兩個很好的資源，將我們常常使用的啟用函式進行了視覺化的說明，並且說明了各種啟用函式的特性。通常針對某些特殊的特徵，一些不常用的啟用函式會有較好的效果。通常也有助於對於啟用函式的理解。網址如下： https://dashee87.github.io/deep learning/vi

神經網路、深度學習、人工智慧、智慧製造2018資料彙編(公號回覆“AI2018資料”下載PDF資料，歡迎轉發、讚賞支援科普)

神經網路、深度學習、人工智慧、智慧製造2018資料彙編(公號回覆“AI2018資料”下載PDF資料，歡迎轉發、讚賞支援科普) 秦隴紀科學Sciences 今天科學Sciences導讀：本文彙編五篇科普文章：一文讀懂神經網路；深度學習並非萬能：你需要避免這三個坑；2018年全球AI

神經網路和深度學習基本原理

這是看到的一篇對神經網路的講解的文章，我覺得寫得很好，也仔細學習了學習，最近我可能也得用這個東西，現在確實是很火啊，也很實用。神經網路和深度學習神經網路：一種可以通過觀測資料使計算機學習的仿生語言範例深度學習：一組強大的神經網路學習技術

Python基於K-均值、RLS演算法實現RBF神經網路（神經網路與機器學習第五章計算機實驗）

1、生成資料集 class moon_data_class(object): def __init__(self,N,d,r,w): self.N=N self.w=w self.d=d self.r=r

神經網路啟用函式學習要點記錄

相關推薦