1. 程式人生 > >吳恩達DeepLearning.ai筆記(5-1)-- 迴圈序列模型

吳恩達DeepLearning.ai筆記(5-1)-- 迴圈序列模型

吳恩達DeepLearning.ai筆記(5-1)– 迴圈序列模型

1.一些序列資料例子

這裡寫圖片描述

2.數學符號

這裡寫圖片描述
x<1>輸入序列X第一個單詞,Txi輸入序列X的單詞個數,Xi<t>第i個輸入序列的第t個單詞

  • one-hot表示法
    這裡寫圖片描述

3.迴圈神經網路模型

這裡寫圖片描述

  • 為什麼不使用傳統的神經網路?

    1. 輸入和輸出資料在不同例子中可以有不同長度,即TxTy 在每個例子中不一定相同;
    2. 從文字不同位置學到的特徵不能共享,舉例來說已經識別出位置x1出現的Herry是人名的一部分,那麼Herry出現在其他位置上,例如位置
      xt
      也是Herry,我們希望它能自動識別出該位置也為人名的一部分。
  • 迴圈神經網路(RNN)

  • RNN兩種表示圖例,RNN的限制是在某一時刻的預測僅使用了序列之前的輸入資訊,沒有使用序列後面的資訊
    這裡寫圖片描述

  • RNN前向傳播
    這裡寫圖片描述

    a<t>=g1(waaa<t1>+waxx<t>+ba)y^<t>=g2(wyaa<t>+by)
    啟用函式g1可以是tanh也可以是Relu,g2
    如果是二分類選擇sigmoid函式,多分類可以用softmax。
  • 簡化RNN符號
    這裡寫圖片描述
  • 通過時間反向傳播
    這裡寫圖片描述
    這裡寫圖片描述
    損失函式
    L<t>(y^<t>,y<t>)=y<t>logy^<t>(1y<t>)log(1y^<t>)L(y
    ^,y)=t=1TyL<t>(y^<t>,y<t>)

4.不同型別的迴圈神經網路

  分為以下五種型別
這裡寫圖片描述
一對一:傳統的神經網路 一對多:音樂生成 多對一:情感分類 多對多(Tx=Ty:命名實體識別 多對多(T_x!=T_y):機器翻譯

5.語言模型和序列生成

  • 什麼是語言模型
    這裡寫圖片描述
      語言模型所做的就是它會告訴你某個特定的句子出現的概率是多少,它是語音識別系統和機器翻譯系統的基本組成部分。語言模型做的基本工作是輸入文字序列