吳恩達DeepLearning.ai筆記(5-1)-- 迴圈序列模型
阿新 • • 發佈:2018-12-27
吳恩達DeepLearning.ai筆記(5-1)– 迴圈序列模型
1.一些序列資料例子
2.數學符號
輸入序列X第一個單詞,輸入序列X的單詞個數,第i個輸入序列的第t個單詞
- one-hot表示法
3.迴圈神經網路模型
為什麼不使用傳統的神經網路?
- 輸入和輸出資料在不同例子中可以有不同長度,即和 在每個例子中不一定相同;
- 從文字不同位置學到的特徵不能共享,舉例來說已經識別出位置出現的Herry是人名的一部分,那麼Herry出現在其他位置上,例如位置
迴圈神經網路(RNN)
RNN兩種表示圖例,RNN的限制是在某一時刻的預測僅使用了序列之前的輸入資訊,沒有使用序列後面的資訊
RNN前向傳播
啟用函式可以是tanh也可以是Relu,如果是二分類選擇sigmoid函式,多分類可以用softmax。- 簡化RNN符號
- 通過時間反向傳播
損失函式
4.不同型別的迴圈神經網路
分為以下五種型別
一對一:傳統的神經網路 一對多:音樂生成 多對一:情感分類 多對多():命名實體識別 多對多(T_x!=T_y):機器翻譯
5.語言模型和序列生成
什麼是語言模型
語言模型所做的就是它會告訴你某個特定的句子出現的概率是多少,它是語音識別系統和機器翻譯系統的基本組成部分。語言模型做的基本工作是輸入文字序列