深度學習總結(三)——學習率設定

阿新 • • 發佈：2019-01-30

這裡寫圖片描述

1. 學習率對訓練的影響

為了能夠使得梯度下降法有較好的效能，我們需要把學習率的值設定在合適的範圍內。太大的學習速率導致學習的不穩定，太小值又導致極長的訓練時間。自適應學習速率通過保證穩定訓練的前提下，達到了合理的高速率，可以減少訓練時間。

2. 學習率的設定

固定學習率的設定：

經驗選擇：一般情況下傾向於選取較小的學習速率以保證系統的穩定性，學習速率的選取範圍在0.01~0.8之間。
對於不同大小的資料集，調節不同的學習率。根據我們選擇的成本函式F()不同，問題會有區別。當平方誤差和（Sum of Squared Errors）作為成本函式時， ∂F(ωj) / ∂ωj 會隨著訓練集資料的增多變得越來越大，因此學習率需要被設定在相應更小的值上。解決此類問題的一個方法是將學習率λ 乘上1/N，N是訓練集中資料量。這樣每步更新的公式變成下面的形式：ωj = ωj - (λ/N) * ∂F(ωj) / ∂ωj
解析：固定學習率是根據cost曲線的走向來不斷調整學習率，最終獲得比較好的初始化。其往往搭配Early Stopping來結束訓練。

可變的學習率：

在每次迭代中調節不同的學習率。在每次迭代中去調整學習率的值是另一種很好的學習率自適應方法。此類方法的基本思路是當你離最優值越遠，你需要朝最優值移動的就越多，即學習率就應該越大；反之亦反。例如：如果相對於上一次迭代，錯誤率減少了，就可以增大學習率，以5%的幅度；如果相對於上一次迭代，錯誤率增大了（意味著跳過了最優值），那麼應該重新設定上一輪迭代ωj 的值，並且減少學習率到之前的50%。
當validation accuracy滿足early stopping時，但是我們可以不stop，而是讓learning rate減半之後讓程式繼續跑。下一次validation accuracy又滿足no-improvement-in-n規則時，我們同樣再將learning rate減半。繼續這個過程，直到learning rate變為原來的1/1024再終止程式。（1/1024還是1/512還是其他可以根據實際確定）。

深度學習總結(三)——學習率設定

1. 學習率對訓練的影響為了能夠使得梯度下降法有較好的效能，我們需要把學習率的值設定在合適的範圍內。太大的學習速率導致學習的不穩定，太小值又導致極長的訓練時間。自適應學習速率通過保證穩定

【深度學習】三維點雲資料集總結

點雲資料集總結三維點雲資料，三維深度學習 1.ShapeNet ShapeNet是一個豐富標註的大規模點雲資料集，其中包含了55中常見的物品類別和513000個三維模型。 2.ShapeNetSem 這是一個小的資料庫，包含了270類的12000個物

dubbo學習總結三消費端

註意服務端註意點發送 blog dubbo tro http ref 消費端跟服務端類似註意點是dubbo：reference 和服務端的dubbo：service做區分消費端主要是處理發送過來的請求 dubbo學習總結三消費端

Orleans學習總結(三)--持久化篇

cor ttr ssa cati write lob conf div love 經過上篇Orleans學習總結(二)--創建工程的介紹，我們的工程已經跑起來了，下面我們來介紹下持久化相關。關於持久化的文檔地址在這http://dotnet.github.io/orlea

《javascript 高級程序設計》學習總結三（1）

java 關鍵字下一個引用 global 討論其他瀏覽器而後 rom 　　　引言：任何語言的核心都必然會描述這門語言的最基本的工作原理，而描述的內容通常都要涉及這門語言的語法、操作符、數據類型、內置功能等用於構建復雜解決方案的基本概念。今天我就這些基本的概念開始進

Spring Boot學習總結三

() 無配置文件 select 就會配置文件配置模式 mysq pre 1，mybatis在spring boot下的2種使用模式無配置文件註解版 application.properties添加相關配置 mybatis.type-aliases-package=c

吳恩達深度學習總結(2)

DeaplearningAI01.weak3 回顧 Logistic Regression 淺層神經網路(只有一層隱藏單元) 網路中每個符號的含義啟用函式的選擇可選函式啟用函式的選擇使用非線性啟

吳恩達深度學習總結(1)

DeaplearningAI01.weak2 forward backward 本週主要介紹了神經網路中forward和backward的一般實現和向量實現。一般實現較為簡單，向量實現中存在一些疑點

Servlet3.0學習總結(三)——基於Servlet3.0的檔案上傳

在Servlet2.5中，我們要實現檔案上傳功能時，一般都需要藉助第三方開源元件，例如Apache的commons-fileupload元件，在Servlet3.0中提供了對檔案上傳的原生支援，我們不需要藉助任何第三方上傳元件，直接使用Servlet3.0提供的API就能夠實現檔案上傳功能了。

深度學習第三課多層感知機

多層感知機針對於中間有隱藏層的神經網路結構，對於資料的每一層傳遞都會相應的多一層[w,b]，這中間使用的傳參函式稱之為啟用函式，如果啟用函式是線性的話，那麼就沒什麼意義，無論中間有多少層，其實和沒有隱藏層是一樣的，所以需要非線性的函式作為啟用函

MyBatis的學習總結三——輸入對映和輸出對映以及多表關聯查詢

關於MyBatis的輸入對映和輸出對映，可輸入的型別很多，輸出型別亦是如此。如圖所示：一、輸入型別是通過引數parameterType來設定的，引數型別有基本資料型別、包裝型別pojo、Map 基礎型別（String，int,long,double...） pojo型別

吳恩達深度學習總結（15）

自然語言處理與詞嵌入詞彙表徵基於遷移學習訓練word embedding 步驟類比推理演算法 Embedding matrix skip gram CBOW 負取樣 GloVe

深度學習（三）Convolutional Neural Network

What is Deep Learning 認識任何事物之前最好了解這一事物在我們的知識認知體系中所處的位置，這樣有助於將其歸納到自己的認知體系中，產生聯絡並編製成類似於知識圖譜樣的結構，不用記住也不好忘記。

吳恩達第一門-神經網路和深度學習第三週6-10學習筆記

吳恩達第一門-神經網路和深度學習第三週6-10學習筆記 3.6啟用函式啟用函式圖中給出了前面課程中所學到的利用神經網路計算輸出值的具體步驟。其中的 σ

Mybatis學習總結三之簡化sql對映xml檔案中的引用及解決欄位名與實體類屬性名不相同的衝突

一、為實體類定義別名，簡化sql對映xml檔案中的引用我們在sql對映xml檔案中的引用實體類時，需要寫上實體類的全類名(包名+類名)，如下：parameterType="com.aiit.pojo.User"這裡寫的實體類User的全類名com.aiit.pojo.User， <i

基於深度學習的三維點雲分類的介紹

轉自博主 particle，該文章翻譯自http://www.itzikbs.com/3d-point-cloud-classification-using-deep-learning 在過去的這些年裡，對二維影象已經有了大量深入的研究，並且有著長足的發

docker學習總結三

獲取映象docker pull 預設從docker hub映象源下載映象格式為docker pull NAME:TAG //:TAG可寫可不寫，不寫預設最新版$ docker pull ubuntu:16.04$ docker pull centos建立容器$ docker run -it centos

六天搞懂“深度學習”之三：多層神經網路

為了克服單層神經網路只能解決線性可分問題的侷限性，神經網路進化為多層結構。然而，花費了將近30年的時間，才將隱藏層新增到單層神經網路中。很難理解為什麼花費了這麼長時間，其中的主要問題是學習規則。單層神經網路中的增量規則對於多層神經網路的訓練是無效的，這是因為訓練中在隱藏層產生的誤差並沒

Python學習總結(三)——Function（函式）

函式定義 def 函式名(): 函式體 return 返回值1, 返回值2 在Python中，函式有五大要點，分別是def、函式名、函式體、引數、返回值，以及兩個英文版符號，分別是括號（括號內為引數）和冒號（:）。　　def：函式的關鍵

老衛帶你學---深度學習中各種學習率的比較

在深度學習中，學習率對於我們是否可以快速找到區域性最小值小值非常重要，而caffe為我們提供瞭如下學習率: fixed:　　保持base_lr不變. step: 　　如果設定為step,則還需要設定一個stepsize, 返回 base_lr *

深度學習總結(三)——學習率設定

1. 學習率對訓練的影響

2. 學習率的設定

相關推薦