吳恩達Deeplearning.ai 第五課 Sequence Model 第一週------Long Short Term Memory(LSTM)

阿新 • • 發佈：2019-01-07

這一節主要講解了LSTM單元

這裡寫圖片描述

LSTM和GRU略有區別，可以說是一種更加通用的GRU模型

在LSTM中，c<t>不再等於a<t>，因此原來公式中的c<t-1>要改成a<t-1>，同時在LSTM中，也沒有了Γr這個門

但不同是，除了同樣保持了Γu這個門之外，還增加了Γf（forget gate）和Γo(output gate)兩個門。在原來c<t>的更新公式中，將(1-Γu)替換為Γf,並且在利用Γo來得到a<t>

LSTM的公式和單元結構：

這裡寫圖片描述

很多個這樣的單元組合起來就成了LSTM network：

這裡寫圖片描述

一些不同的版本：

這裡寫圖片描述

同樣，在這裡面，有時候也會在gate的計算中加入c<t-1>項，即變成Wu[a<t-1>, x<t>, c<t-1>]等，這被稱為peephole connection

但在這裡面c<t-1>的每個元素隻影響gate中對應的某個元素，而不會影響gate中其他位置的元素

LSTM和GRU的選擇：

1.關於二者孰優孰劣並沒有明確的論斷，在實際專案中可以進行嘗試。

2.GRU的優點是隻需要兩個門，計算量更小，當要搭建大型神經網路時可以更好得scaling（感覺這個詞只可意會不可翻譯）

3.LSTM的優點是有三個門，因此效率更高，但是計算量更大。
在現在的一些研究中，使用LSTM的會更多一些

吳恩達Deeplearning.ai 第五課 Sequence Model 第一週------Long Short Term Memory(LSTM)

這一節主要講解了LSTM單元 LSTM和GRU略有區別，可以說是一種更加通用的GRU模型在LSTM中，c<t>不再等於a<t>，因此原來公式中的c<t-1>要改成a<t-1>，同時在LSTM中，也沒有了Γ

吳恩達Deeplearning.ai 第五課 Sequence Model 第一週------Deep RNNs

這一節主要講解了深度RNN網路的結構。左邊是在一般的神經網路中DNN的結構，由輸入經過多層網路最終得到輸出與此類似，Deep RNN也有類似的結構，之前的RNN網路都只是一層，如圖畫出了三層。用a[l]<t>來表示第l層激勵的第t個t

吳恩達Deeplearning.ai 第五課 Sequence Model 第一週------Sampling novel sequence

這一節主要講了如何從一個訓練好的RNN中進行取樣得到序列從訓練好的RNN中取樣出一個序列之前在序列產生中講到，首先RNN輸入a<0>(0向量)和x<1>(0向量)，通過一個RNN cell產生一個輸出y。 y = softm

吳恩達Deeplearning.ai 第五課 Sequence Model 第一週------Recurrent Neural Network Model

這一節內容比較多，主要講述瞭如何搭建一個RNN標準單元使用標準神經網路的不足： 1.不同樣本的輸入輸出長度不等（雖然都可以padding成最大長度的樣本） 2.（更主要的原因）text不同的位置之間不共享學習到的引數 RNN模型，可以用左邊也可

吳恩達Deeplearning.ai 第五課 Sequence Model 第一週------Backpropagation through time

這一節主要講了RNN的反向傳播過程 BP即從輸出到輸入，因此和FP是相反的一些箭頭計算a的引數Wa和ba,計算y的引數Wy和by，綠色的箭頭表示在這些不同的a和y的計算中都要用到這些引數（這裡展示的是一層RNN，後面會講到多層，在這一層中，不同的c

Coursera 吳恩達DeepLearning.AI 第五課 sequence model 序列模型第一週 Improvise a Jazz Solo with an LSTM Network

We have taken care of the preprocessing of the musical data to render it in terms of musical "values." You can informally think of each "value" as a note,

Coursera 吳恩達DeepLearning.AI 第五課 sequence model 序列模型第二週 Emofify

這個Emojify裡最坑的一個就是，avg初始化的時候一定要是 (50,) ，如果你用(word_to_vec_map["a"]).shape 就死活過不了。Emojify!Welcome to the second assignment of Week 2. You are going to use wor

吳恩達deeplearning.ai第四課學習心得：卷積神經網路與計算機視覺

不久前，Coursera 上放出了吳恩達 deeplearning.ai 的第四門課程《卷積神經網路》。本文是加拿大國家銀行首席分析師 Ryan Shrott 在完成該課程後所寫的學習心得，有助於大家直觀地瞭解、學習計算機視覺。我最近在 Coursera 上完成了吳恩達教授的計算機視覺課程。吳恩達

吳恩達 Coursera Deep Learning 第五課 Sequence Models 第一週程式設計作業 3

Improvise a Jazz Solo with an LSTM Network Welcome to your final programming assignment of this week! In this notebook, you will im

【Coursera】吳恩達 deeplearning.ai 04.卷積神經網路第二週深度卷積神經網路課程筆記

深度卷積神經網路 2.1 為什麼要進行例項化實際上，在計算機視覺任務中表現良好的神經網路框架，往往也適用於其他任務。 2.2 經典網路 LeNet-5 AlexNet VGG LeNet-5 主要針對灰度影象隨著神經網路的加深

吳恩達deeplearning.ai五項課程完整筆記了解一下？

來源：機器之心本文共3744字，建議閱讀8分鐘。通過本文為大家解讀如何構建自然語言、音訊和其他序

吳恩達 DeepLearning.ai 課程提煉筆記（4-2）卷積神經網絡 --- 深度卷積模型

mes and shift abd actual 應用比賽特征通道 1. 經典的卷積網絡介紹幾種經典的卷積神經網絡結構，分別是LeNet、AlexNet、VGGNet。 LeNet-5： LeNet-5主要是針對灰度設計的，所以其輸入較小，為，其結構如下：

吳恩達Deeplearning.ai 知識點梳理（course 5，week 3）

本週主要講了多種sequence to sequence結構，包括conditional language model，beam searching，bleu，attention，speech recognition，以及trigger word detec

吳恩達DeepLearning.ai《深度學習》課程筆記目錄總集

本文釋出在知乎的專欄中，為了方便習慣使用CSDN的使用者，更改了下面文章的直鏈到CSDN中的筆記。同時，也歡迎大家關注我的知乎：大樹先生，會不定期有新的乾貨更新。一起學習一起進步呀！^_^ DeepLearning.ai簡介 deepLearning.

吳恩達DeepLearning.ai筆記（5-1）-- 迴圈序列模型

吳恩達DeepLearning.ai筆記（5-1）– 迴圈序列模型 1.一些序列資料例子 2.數學符號 x<1>x<1>輸入序列X第一個單詞，TixTxi輸入序列X的單詞個數，X（i）<t>X（i）&l

【Coursera】吳恩達 deeplearning.ai 05.序列模型第一週迴圈序列模型課程筆記

迴圈序列模型為什麼選擇序列模型在語音識別、音樂生成、情感分類、DNA序列分析、機器翻譯、視訊識別、命名實體識別等任務中，共同特點是輸入X和/或輸出Y都是序列。數學符號例如，對於命名實體識別的問題：對於輸入序列，用 x&l

Coursera 吳恩達 Deep Learning 第2課 Improving Deep Neural Networks 第一週程式設計作業程式碼 Regularization

2 - L2 Regularization # GRADED FUNCTION: compute_cost_with_regularization def compute_cost_with_reg

吳恩達DeepLearning.ai系列課後程式設計題實踐總結week3

# -*- coding: utf-8 -*- """ Created on Sun Sep 24 09:09:10 2017 @author: Jay """ import numpy as np import matplotlib.pyplot as p

心得丨吳恩達Deeplearning.ai 全部課程學習心得分享

選自Medium作者：Ryan Shrott 機器之心編譯本文作者，加拿大國家銀行首席分析師 Ryan Shrott 完成了迄今為止（2017 年 10 月 25 日）吳恩達在 Coursera 上釋出的所有深度學習課程，併為我們提供了課程解讀。目前 Coursera 上可用的課程中，

吳恩達deeplearning.ai課程系列筆記05（下）

#寫在最前，deeplearning.ai系列課程相較於之前的Andrew Ng在coursera上2014釋出的機器學習課程內容更加豐富。重要的是此次課程示例程式碼都是用python來實現，不需要去熟悉octave，對大部分需要用python來學習機器學習的同學來說

吳恩達Deeplearning.ai 第五課 Sequence Model 第一週------Long Short Term Memory(LSTM)

相關推薦