吳恩達深度學習專項課程2學習筆記/week2/Optimization Algorithms

阿新 • • 發佈：2018-02-18

sce 適應耗時 bubuko 優化算法 src bat -a 過程

Optimization algorithms

優化算法以加速訓練。

Mini-batch gradient descend

Batch gradient descend：每一小步梯度下降否需要計算所有的訓練樣本。很耗時。
Mini-batch gradient descend：將訓練集分為很多小的mini-batch，每一個epoch用到一個mini-batch的訓練樣本，進行一次梯度下降（向前傳播，計算cost，向後傳播）。訓練速度會提升很多。

選擇mini-batch的size

如果size=1：隨機梯度下降，過程會曲折反復，不收斂，在最優值附近徘徊（紫色線）。一個很大的缺點在於每次只處理一個樣本，失去了向量化的提升效率的作用。
如果size=m：批梯度下降，過程比較直接但是每步都很耗時。（藍色線）
size適中，則可以既利用到向量化的作用，又每一步下降不需要耗時過長，因此效率較高。（綠色線）

技術分享圖片

size選擇大致原則：

如果訓練集很小（如m <= 2000）：Batch gradient descend
如果訓練集相對大，那麽典型的mini-batch的大小如：64，128，256，512。考慮到計算機的內存，所以常用的mini-batch都是2的次方。
確保mini-batch和計算機CPU/GPU的內存相適應。

mini-batch size是需要調整的超參數之一，嘗試不同的值，然後選擇一個最好的。

（未完待續）

吳恩達深度學習專項課程2學習筆記/week2/Optimization Algorithms

sce 適應耗時 bubuko 優化算法 src bat -a 過程 Optimization algorithms 優化算法以加速訓練。 Mini-batch gradient descend Batch gradient descend：每一小步梯度下降否需要計算所

完結篇 | 吳恩達deeplearning.ai專項課程精煉筆記全部彙總

從去年8月份開始，AI界大IP吳恩達在coursera上開設了由5們課組成的深度學習專項課程，掀起了一股人工智慧深度學習熱潮。這裡附上deeplearning.ai的官網：關於該深度學習專項課程，本人非常推薦！它對於理解各種演算法背後的原理非常有幫助，同時提供了大量的應用場景

吳恩達-深度學習-課程筆記-3: Python和向量化( Week 2 )

有時指數檢查都是效果很快 -1 tro str 1 向量化( Vectorization ) 在邏輯回歸中，以計算z為例，z = w的轉置和x進行內積運算再加上b，你可以用for循環來實現。但是在python中z可以調用numpy的方法，直接一句z = np.d

吳恩達深度學習專項課程3學習筆記/week2/Error analysis

ini 調整數據 class http 評估參數 pos 修正 Error analysis Carrying out error analysis Error analysis是手動分析算法錯誤的過程。通過一個例子來說明error analysis的過程。假設你在做

吳恩達深度學習課程deeplearning.ai課程作業：Class 4 Week 2 Residual Networks

吳恩達deeplearning.ai課程作業，自己寫的答案。補充說明： 1. 評論中總有人問為什麼直接複製這些notebook執行不了？請不要直接複製貼上，不可能執行通過的，這個只是notebook中我們要自己寫的那部分，要正確執行還需要其他py檔案，請

吳恩達深度學習課程deeplearning.ai課程作業：Class 4 Week 2 Keras

吳恩達深度學習課程deeplearning.ai課程作業：Class 2 Week 3 TensorFlow Tutorial

吳恩達-深度學習-課程筆記-6: 深度學習的實用層面( Week 1 )

data 絕對值 initial 均值化 http 梯度下降法 ati lod 表示 1 訓練/驗證/測試集( Train/Dev/test sets ) 構建神經網絡的時候有些參數需要選擇，比如層數，單元數，學習率，激活函數。這些參數可以通過在驗證集上的表現好壞來進行選擇

吳恩達-深度學習-課程筆記-8: 超參數調試、Batch正則化和softmax( Week 3 )

erp 搜索給定 via 深度 mode any .com sim 1 調試處理( tuning process ) 如下圖所示，ng認為學習速率α是需要調試的最重要的超參數。其次重要的是momentum算法的β參數（一般設為0.9），隱藏單元數和mini-batch的

吳恩達深度學習2-Week2課後作業3-優化演算法

一、deeplearning-assignment 到目前為止，在之前的練習中我們一直使用梯度下降來更新引數並最小化成本函式。在本次作業中，將學習更先進的優化方法，它在加快學習速度的同時，甚至可以獲得更好的最終值。一個好的優化演算法可以讓你幾個小時內就獲得一個結果，而不是等待幾天。 1.

吳恩達深度學習2-Week1課後作業3-梯度檢測

一、deeplearning-assignment 神經網路的反向傳播很複雜，在某些時候需要對反向傳播演算法進行驗證，以證明確實有效，這時我們引入了“梯度檢測”。反向傳播需要計算梯度 , 其中θ表示模型的引數。J是使用前向傳播和損失函式計算的。因為前向傳播實現相對簡單, 所以

吳恩達深度學習總結(2)

DeaplearningAI01.weak3 回顧 Logistic Regression 淺層神經網路(只有一層隱藏單元) 網路中每個符號的含義啟用函式的選擇可選函式啟用函式的選擇使用非線性啟

吳恩達深度學習2-Week3課後作業-Tensorflow

一、deeplearning-assignment 到目前為止，我們一直使用numpy來建立神經網路。這次作業將深入學習框架，可以更容易地建立神經網路。 TensorFlow，PaddlePaddle，Torch，Caffe，Keras等機器學習框架可以顯著地加速機器學習開發。這些框架有

Elam的吳恩達深度學習課程筆記（一）

記憶力是真的差，看過的東西要是一直不用的話就會馬上忘記,於是乎有了寫部落格把學過的東西儲存下來，大概就是所謂的集鞏固，分享，後期查閱與一身的思想吧，下面開始正題深度學習概論什麼是神經網路什麼是神經網路呢，我們就以房價預測為例子來描述一個最簡單的神經網路模型。　　假設有6間

吳恩達深度學習4-Week2課後作業2-殘差網路

一、Deeplearning-assignment 在本次作業中，我們將學習如何通過殘差網路(ResNets)建立更深的卷及網路。理論上，深層次的網路可以表示非常複雜的函式，但在實踐中，他們是很難建立和訓練的。殘差網路使得建立比以前更深層次的網路成為可能。對於殘差網路的詳細講解，具體可參考該

吳恩達深度學習4-Week4課後作業2-Neural Style Transfer

一、Deeplearning-assignment 在本節的學習中，我們將學習神經風格遷移（Neural Style Transfer）演算法，通過該演算法使得兩張不同風格的圖片融合成一張圖片。問題描述：神經風格遷移演算法是深度學習中的一種有趣的技術。正如下面的圖片所示，演算法將兩種圖

優化演算法（吳恩達深度學習課程）-- 2018.11.02筆記

優化演算法（吳恩達深度學習課程） batch梯度下降使用batch梯度下降時，每次迭代你都需要遍歷整個訓練集，可以預期每次成本都會下降，所以如果成本函式

吳恩達深度學習課程學習總結

本文章主要總結吳恩達DeepLearning課程中所提到的一些機器學習策略 1、啟用函式 Sigmoid函式 tanh函式 ReLU函式 2、權重初始化全零初始化的弊端：若權重初始化為0，則在訓練過程中，每個隱含層之間存在對稱性，即在訓練過程中，每個隱含層的求導等

吳恩達深度學習2-Week1課後作業2-正則化

一、deeplearning-assignment 這一節作業的重點是理解各個正則化方法的原理，以及它們的優缺點，而不是去注重演算法實現的具體末節。問題陳述：希望你通過一個數據集訓練一個合適的模型，從而幫助推薦法國守門員應該踢球的位置，這樣法國隊的球員可以用頭打。法國過

吳恩達深度學習4.2練習_Convolutional Neural Networks_Happy House & Residual Networks

1、Happy House 1.1、 Load Dataset 1.2、構建流圖：def HappyModel 1.3、PlaceHolder --> happyModel = HappyModel((64,64,3))

吳恩達深度學習專項課程2學習筆記/week2/Optimization Algorithms

Optimization algorithms

Mini-batch gradient descend

選擇mini-batch的size

相關推薦