基於Theano的深度學習(Deep Learning)框架Keras學習隨筆-03-優化器

阿新 • • 發佈：2019-02-16

optimizers（優化器）。機器學習包括兩部分內容，一部分是如何構建模型，另一部分就是如何訓練模型。訓練模型就是通過挑選最佳的優化器去訓練出最優的模型。

Keras包含了很多優化方法。比如最常用的隨機梯度下降法(SGD)，還有Adagrad、Adadelta、RMSprop、Adam等。下面通過具體的程式碼介紹一下優化器的使用方法。最重要的就是SGD，其他的優化器有興趣的可以自行了解一下。

一、優化器的使用方法

在編譯一個Keras模型時，優化器是2個引數之一（另外一個是損失函式）。看如下程式碼：

model = Sequential()
model.add(Dense(64, init='uniform', input_dim=10))
model.add(Activation('tanh'))
model.add(Activation('softmax'))
 
sgd = SGD(lr=0.1, decay=1e-6, momentum=0.9, nesterov=True)
model.compile(loss='mean_squared_error', optimizer=sgd)

這個例子中是在呼叫compile之前例項化了一個優化器。我們也可以通過傳遞名字的方式呼叫預設的優化器。程式碼如下：

# passoptimizer by name: default parameters will be used
model.compile(loss='mean_squared_error', optimizer='sgd')

二、基類

keras.optimizers.Optimizer(**kwargs)

所有的優化器都繼承自上面這個帶有keyword引數的類。當然基類是不能用來訓練模型的。

三、SGD（隨機梯度下降優化器，價效比最好的演算法）

keras.optimizers.SGD(lr=0.01, momentum=0., decay=0., nesterov=False)

引數：

lr :float>=0，學習速率
momentum :float>=0 引數更新的動量
decay : float>=0 每次更新後學習速率的衰減量
nesterov :Boolean 是否使用Nesterov動量項

四、Adagrad（引數推薦使用預設值）

keras.optimizers.Adagrad(lr=0.01, epsilon=1e-6)

引數：

lr : float>=0，學習速率
epsilon :float>=0

五、Adadelta（引數推薦使用預設值）

keras.optimizers.Adadelta(lr=1.0, rho=0.95, epsilon=1e-6)

引數：

lr :float>=0，學習速率
rho : float>=0
epsilon :float>=0 模糊因子

六、RMSprop（引數推薦使用預設值）

keras.optimizers.RMSprop(lr=0.001, rho=0.9, epsilon=1e-6)

引數：

lr:float>=0，學習速率
rho : float>=0
epsilon : float>=0 模糊因子

七、Adam（引數推薦使用預設值）

keras.optimizers.Adam(lr=0.001, beta_1=0.9, beta_2=0.999, epsilon=1e-8)

引數：

lr : float>=0，學習速率
beta_1, beta_2:floats, 0 < beta < 1 通常都是接近於1
epsilon :float>=0 模糊因子

參考資料：

基於Theano的深度學習(Deep Learning)框架Keras學習隨筆-01-FAQ

本文主要介紹一下Keras的問答部分，其實很簡單，後邊可能不會詳細說到，提前涼一下，便於翻看。 Keras介紹： Keras是一個極度簡化、高度模組化的神經網路第三方庫。基於Python+Th

基於Theano的深度學習(Deep Learning)框架Keras學習隨筆-08-規則化(規格化)

通過前幾篇的介紹，網路已經選擇好了優化器、目標函式、模型以及啟用函式。並且給權值選擇了初始化方法。那麼接下來就是訓練。訓練過程後會出現什麼問題呢？過擬合！而有效解決過擬合的方法就是加入規則項。具體的

基於Theano的深度學習(Deep Learning)框架Keras學習隨筆-03-優化器

optimizers（優化器）。機器學習包括兩部分內容，一部分是如何構建模型，另一部分就是如何訓練模型。訓練模型就是通過挑選最佳的優化器去訓練出最優的模型。 Keras包含了很

深度學習 deep learning 深度學習框架 caffe 深入學習過程

深度學習（Deep Learning）核心技術開發與應用培訓班主辦單位：中國管理科學研究院執業資格認證培訓中心一，時間地點： 2018年09月13日— 2018年09月16日北京（機房上課，每人一臺電腦進行實際案例操作，贈送 U盤拷貝資料及課件和軟體）二，培訓目標： 1，

深度學習 Deep Learning UFLDL 最新Tutorial 學習筆記 4：Debugging: Gradient Checking

style inline add tom radi posit math size tutorial 1 Gradient Checking 說明前面我們已經實現了Linear Regression和Logistic Regression。關鍵在於代價函數Cost Fun

機器學習 Machine Learning 深度學習 Deep Learning 資料

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

機器學習 Machine Learning 深度學習 Deep Learning 資料 Chapter 1

Python深度學習(Deep Learning with Python) 中文版+英文版+原始碼

Keras作者、谷歌大腦François Chollet最新撰寫的深度學習Python教程實戰書籍（2017年12月出版）介紹深入學習使用Python語言和強大Keras庫，詳實新穎。PDF高清中文版+英文版+原始碼，這本書讓你通過直觀的解釋和例項學習深度學習，不得不看。下載地址：https://www.

深度學習框架Keras學習系列（一）：線性代數基礎與numpy使用（Linear Algebra Basis and Numpy）

又開一個新坑~~ 因為確實很有必要好好地趁著這個熱潮來研究一下深度學習，畢竟現在深度學習因為其效果突出，熱潮保持高漲不退，上面的政策方面現在也在向人工智慧領域傾斜，但是也有無數一知半解的人跟風吹捧，於是希望藉此教程，讓自己和讀者一起藉助keras，從上到下逐漸

深度學習(deep learning) AI聖經

AI 菌連結：https://pan.baidu.com/s/1sluS7tb 密碼：c5se伊

學習人工智慧的第六個月[深度學習[Deep Learning，DL]]

　　這個月閱讀了論文[Partial Adversarial Domain Adaptation-eccv18]，文章著眼於源域標籤空間包含目標域標籤空間的場景，在域對抗神經網路的基礎上提出了部分對抗域適應方法。思想很容易理解，即在源域樣本空間中引入了權值，希望源域和目標域共有的標籤權值大一些，不共有的權值儘

機器學習——深度學習(Deep Learning)

Deep Learning是機器學習中一個非常接近AI的領域，其動機在於建立、模擬人腦進行分析學習的神經網路，最近研究了機器學習中一些深度學習的相關知識，本文給出一些很有用的資料和心得。Key Words：有監督學習與無監督學習，分類、迴歸，密度估計、聚類，深度學習，Spar

【深度學習Deep Learning】資料大全

介紹:使用卷積神經網路的影象縮放. 介紹:ICML2015 論文集,優化4個+稀疏優化1個；強化學習4個，深度學習3個+深度學習計算1個；貝葉斯非參、高斯過程和學習理論3個；還有計算廣告和社會選擇.ICML2015 Sessions. 介紹:使用卷積神經網路的影象縮放. 介紹:，第28屆IEEE計算機視覺與

機器學習(Machine Learning)與深度學習(Deep Learning)資料之文章、部落格

介紹:這是一篇介紹機器學習歷史的文章，介紹很全面，從感知機、神經網路、決策樹、SVM、Adaboost到隨機森林、DeepLearning.介紹:這一篇介紹如果設計和管理屬於你自己的機器學習專案的文章，裡面提供了管理模版、資料管理與實踐方法.介紹:如果你還不知道什麼是機器學習

深度學習Deep Learning（04）：權重初始化問題2_ReLu激勵函式

三、權重初始化問題2_ReLu激勵函式 1、說明 2、ReLu/PReLu激勵函式目前ReLu啟用函式使用比較多，而上面一篇論文沒有討論，如果還是使用同樣初始化權重的方法（

機器學習(Machine Learning)&深度學習(Deep Learning)資料集合

機器學習(Machine Learning)&深度學習(Deep Learning)資料原文連結：https://github.com/ty4z2008/Qix/blob/master/dl.md#%E6%B3%A8%E6%9C%BA%E5%99%A8

淺談深度學習(Deep Learning)的基本思想和方法

深度學習（Deep Learning），又叫Unsupervised Feature Learning或者Feature Learning，是目前非常熱的一個研究主題。本文將主要介紹Deep Learning的基本思想和常用的方法。一. 什麼是Deep Learning

深度學習(Deep Learning) Yoshua Bengio & Ian GoodFellow中文版

今天給大家推薦一本入門深度學習必讀的權威教材，由深度學習權威Yoshua Bengio和GAN之父Ian Goodfellow等人合著的DeepLearning經典教程《Deep Learning》。廢話不多說，直接上鍊接。中文版pdf下載地址：https://

Coursera 深度學習 deep learning.ai 吳恩達神經網路和深度學習第一課第二週程式設計作業 Python Basics with Numpy

Python Basics with Numpy (optional assignment) Welcome to your first assignment. This exercise gives you a brief introduction to P

機器學習(Machine Learning)&深度學習(Deep Learning)資料

介紹:這是一篇介紹機器學習歷史的文章，介紹很全面，從感知機、神經網路、決策樹、SVM、Adaboost到隨機森林、Deep Learning. 介紹:這是瑞士人工智慧實驗室Jurgen Schmidhuber寫的最新版本《神經網路與深度學習綜述》本綜述的特點是以時間排序，

基於Theano的深度學習(Deep Learning)框架Keras學習隨筆-03-優化器

optimizers（優化器）。機器學習包括兩部分內容，一部分是如何構建模型，另一部分就是如何訓練模型。訓練模型就是通過挑選最佳的優化器去訓練出最優的模型。

Keras包含了很多優化方法。比如最常用的隨機梯度下降法(SGD)，還有Adagrad、Adadelta、RMSprop、Adam等。下面通過具體的程式碼介紹一下優化器的使用方法。最重要的就是SGD，其他的優化器有興趣的可以自行了解一下。

一、優化器的使用方法

二、基類

三、SGD（隨機梯度下降優化器，價效比最好的演算法）

四、Adagrad（引數推薦使用預設值）

五、Adadelta（引數推薦使用預設值）

六、RMSprop（引數推薦使用預設值）

七、Adam（引數推薦使用預設值）

相關推薦