[深度學習] 神經網路中的啟用函式（Activation function）

阿新 • • 發佈：2018-12-12

20180930 在研究調整FCN模型的時候，對啟用函式做更深入地選擇，記錄學習內容

啟用函式（Activation Function），就是在人工神經網路的神經元上執行的函式，負責將神經元的輸入對映到輸出端。

在這裡插入圖片描述

線性啟用函式：最簡單的linear function就是f(x) = x，不對輸入進行修改就直接輸出
非線性啟用函式：這些函式用於對不可線性分離的資料進行分離，是最常用的啟用函式。非線性方程控制從輸入到輸出的對映。常用的非線性啟用函式的例子是Sigmoid，tanH，ReLU，LReLU，PReLU，Swish等。

使用啟用函式的原因

單層感知機 Perceptron

這是一個單層的感知機，也是我們最常用的神經網路組成單元，用它可以在平面中劃出一條線，把平面分割開，進行二分類。

在這裡插入圖片描述

多感知機組合 Perceptron

多個感知機組合，能夠在平面中進行更復雜的分割，獲得更強的分類能力。

在這裡插入圖片描述

由感知機的結構來看，如果不用激勵函式，每一層輸出都是上層輸入的線性函式，無論神經網路有多少層，輸出都是輸入的線性組合，無法直接進行非線性分類

在這裡插入圖片描述

所以，我們要加入一種方式來完成非線性分類，這個方法就是啟用函式。

單層感知機
多層感知機

如果使用的話，啟用函式給神經元引入了非線性因素，使得神經網路可以任意逼近任何非線性函式，這樣神經網路就可以應用到眾多的非線性模型中。

使用step啟用函式的線性模型（step下面有介紹）
使用其他啟用函式的非線性模型，可能學習出更多的平滑分類

總結，使用啟用函式可以在神經網路中引入非線性分類方式，從而完成線性模型所不能完成的分類，解決真正的實際問題。

常用的啟用函式

step
- 圖形
Sigmoid
- 圖形
- 導數
- Tensorflow中tf.sigmoid
- 缺點
  - Sigmoid有一個非常致命的缺點，當輸入非常大或者非常小的時候（saturation），這些神經元的梯度是接近於0的。如果你的初始值很大的話，神經元可能會停止梯度下降過程，這會導致網路變的無法學習。
  - Sigmoid的曲線均值不為0，這會導致後一層的神經元將得到上一層輸出的非0均值的訊號作為輸入。產生的一個結果就是：如果資料進入神經元的時候是正的，那麼計算出的梯度也會始終都是正的。如果是進行批訓練，訓練過程中會得到不同的訊號，這樣會緩解非0均值帶來的影響。
TanH
- 圖形
- 導數
- Tensorflow使用tf.tanh
- 缺點：實際上從根本上是sigmoid函式的變形體，解決了非0均值的問題，但不能解決過大或者過小時候導數接近於0的問題
Rectified linear unit (ReLU)
- 圖形
- 導數
- Tensorflow使用tf.nn.relu(features, name = None)
- 缺點：不幸的是，使用ReLU的神經元在訓練期間可能很脆弱並且可能“死亡”。例如，經過ReLU神經元的梯度過大的下降可能導致權重可能不在更新（因為x<0時，y的值和導數都為0），即神經元將永遠不再在任何資料點上啟用。如果發生這種情況，那麼經過該神經元的梯度將從該點開始永遠為0。也就是說，ReLU神經元可以在訓練期間不可逆轉地死亡。例如，如果學習率設定得太高，您可能會發現多達40％的網路可能“死”（即永遠不會在整個訓練資料集中啟用的神經元）。通過適當設定學習率，這也不是一個問題。
Leaky ReLU
- 圖形
- Tensorflow使用 tf.nn.leaky_relu(features, alpha=0.2, name=None)，其中alpha為x<0時的斜率
- 解決了ReLU的“死”神經元問題
更多啟用函式詳細內容

在這裡插入圖片描述

ReLU應該是現階段使用最多的啟用函式。

深度學習計算模型中“門函式（Gating Function）”的作用

/*.*/ author: 張俊林看深度學習文獻，門函式基本上已經是你必然會遇到的一個概念了，最典型的就是LSTM，首先上來你就得過得去“遺忘門”“輸入門”“輸出門”這三個

[深度學習] 神經網路中的啟用函式（Activation function）

20180930 在研究調整FCN模型的時候，對啟用函式做更深入地選擇，記錄學習內容啟用函式（Activation Function），就是在人工神經網路的神經元上執行的函式，負責將神經元的輸入對映到輸出端。線性啟用函式：最簡單的linear fun

為什麼神經網路中需要啟用函式（activation function）？

在看tensorflow的時候，發現書中程式碼提到，使用ReLU啟用函式完成去線性化為什麼需要啟用函式去線性化？查了一下quaro，覺得這個回答能看明白（順便問一句，截圖算不算引用？？）---------------------------------------------

神經網路中的啟用函式（activation function）-Sigmoid, ReLu, TanHyperbolic(tanh), softmax, softplus

　　不管是傳統的神經網路模型還是時下熱門的深度學習，我們都可以在其中看到啟用函式的影子。所謂啟用函式，就是在神經網路的神經元上執行的函式，負責將神經元的輸入對映到輸出端。常見的啟用函式包括Sigmoid、TanHyperbolic(tanh)、ReLu、 sof

機器學習（一）：啟用函式（Activation Function）

0. 啟用函式上圖為wiki上的定義：啟用函式定義了每個節點（神經元）的輸出和輸入關係的函式。下表：常用啟用函式編號函數公式 1) sigmoid(

啟用函式（Activation function）

神經網路中使用啟用函式來加入非線性因素，提高模型的表達能力。 ReLU(Rectified Linear Unit,修正線性單元) f(x)={0,x,x≤0x>0f(x)={0,x≤0x,x>0 詳細公式ReLU: f(x)其中σ(z)=∑i=1infσ(x−i+0.5)≈log

深度學習神經網路中正則化的使用

目錄前言如果訓練資料集不夠大，由於深度學習模型具有非常大的靈活性和容量，以至於過度擬合可能是一個嚴重的問題，為了解決這個問題，引入了正則化的這個方法。要在神經網路中加入正則化，除了在啟用層中加入正則函式，應該dropout也是可以起到正則的效果

深度學習——神經網路中的activation

A：如果不用啟用函式（其實相當於啟用函式是f(x) = x），在這種情況下你每一層輸出都是上層輸入的線性函式，很容易驗證，無論你神經網路有多少層，輸出都是輸入的線性組合，與沒有隱藏層效果相當，這種情況就是最原始的感知機（Perceptron）了。引入非線性函式作為啟用函式，這樣深層神經網路就有意義了（不再是輸

【深度學習技術】卷積神經網路常用啟用函式總結

本文記錄了神經網路中啟用函式的學習過程，歡迎學習交流。神經網路中如果不加入啟用函式，其一定程度可以看成線性表達，最後的表達能力不好，如果加入一些非線性的啟用函式，整個網路中就引入了非線性部分，增加了網路的表達能力。目前比較流行的啟用函式主要分為以下7種：

神經網路常用啟用函式對比 sigmoid VS sofmax（附python原始碼）

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

深度學習 --- 神經網路的學習原理（學習規則）

從今天開始進入深度學習領域，深度學習我在前兩年的理論學習過程中，體會頗深，其中主要有兩個演算法CNN和RNN，但是本人喜歡追本溯源，喜歡刨根問題。最重要的是每個演算法並不是拍腦袋想出來的，是根據當時的研究程序和研究環境有關，因此想要深入理解深度學習的精髓，我們需要去了

深度學習基礎--loss與啟用函式--CTC（Connectionist temporal classification）的loss

CTC（Connectionist temporal classification）的loss 用在online sequence。由於需要在分類結果中新增一個{no gesture}的類別，如果用在segmented video的分類時，需要去掉這類（因為視訊總屬於某個類）。

深度學習神經網路中文入門書籍課程推薦（附免費下載連結）

現如今，人工智慧/深度學習/Deep Learning 異常火爆，可惜是網路上絕大部分推薦的入門書籍/課程都是英文的，本來數學基礎就不行，又是英文資料著實讓人頭疼。這裡咪博士向大家推薦 2 份非常不錯的中文入門資料。是的，只有 2 份！好東西不在於多，而在於精。一、臺灣大

吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（1-2）-- 神經網路基礎

以下為在Coursera上吳恩達老師的DeepLearning.ai課程專案中，第一部分《神經網路和深度學習》第二週課程部分關鍵點的筆記。筆記並不包含全部小視訊課程的記錄，如需學習筆記中捨棄的內容請至Coursera 或者網易雲課堂。同時在閱讀以下

吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（5-1）-- 迴圈神經網路

Ng最後一課釋出了，撒花！以下為吳恩達老師 DeepLearning.ai 課程專案中，第五部分《序列模型》第一週課程“迴圈神經網路”關鍵點的筆記。同時我在知乎上開設了關於機器學習深度學習的專欄收錄下面的筆記，以方便大家在移動端的學習。歡迎關

Coursera深度學習課程 DeepLearning.ai 提煉筆記（1-2）-- 神經網路基礎

以下為在Coursera上吳恩達老師的DeepLearning.ai課程專案中，第一部分《神經網路和深度學習》第二週課程部分關鍵點的筆記。筆記並不包含全部小視訊課程的記錄，如需學習筆記中捨棄的內容請至Coursera 或者網易雲課堂。同時在閱讀以下筆記之前，

深度學習之啟用函式（Python實現）

import matplotlib.pyplot as plt import numpy as np import tensorflow as tf from tensorflow.python.framework import ops ops.reset_defau

吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（1-3）-- 淺層神經網路

以下為在Coursera上吳恩達老師的DeepLearning.ai課程專案中，第一部分《神經網路和深度學習》第三週課程“淺層神經網路”部分關鍵點的筆記。筆記並不包含全部小視訊課程的記錄，如需學習筆記中捨棄的內容請至Coursera 或者網易雲課堂

吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（1-4）-- 深層神經網路

以下為在Coursera上吳恩達老師的DeepLearning.ai課程專案中，第一部分《神經網路和深度學習》第四周課程“深層神經網路”部分關鍵點的筆記。筆記並不包含全部小視訊課程的記錄，如需學習筆記中捨棄的內容請至 Coursera 或者網易雲課

[深度學習]神經網路的理解（MLP RBF RBM DBN DBM CNN 整理學習）

開篇語文章整理自向世明老師的PPT，圍繞神經網路發展歷史，前饋網路（單層感知器，多層感知器，徑向基函式網路RBF），反饋網路（Hopfield網路，聯想儲存網路，SOM，Boltzman及受限的玻爾茲曼機RBM，DBN，CNN）三部分進行講述，給人一個神經網路的整體認識。發展歷史單層感知器

[深度學習] 神經網路中的啟用函式（Activation function）

使用啟用函式的原因

常用的啟用函式

相關推薦