神經網路與深度學習[邱錫鵬] 第六章習題解析

阿新 • • 發佈：2021-11-03

6-1

三者都是典型的神經網路模型。
卷積神經網路是對前饋神經網路增加捲積層和池化層。
延時神經網路是對前饋神經網路增加延時器。
迴圈神經網路是對前饋神經網路增加自反饋的神經元。

延時神經網路和迴圈神經網路是給網路增加短期記憶能力的兩種重要方法。

卷積神經網路和迴圈神經網路的區別在迴圈層上。
卷積神經網路沒有時序性的概念，輸入直接和輸出掛鉤；迴圈神經網路具有時序性，當前決策跟前一次決策有關。
舉個例子，進行手寫數字識別的時候，我們並不在意前一個決策結果是什麼，需要用卷積神經網路；（影象識別）
而自然語言生成時，上一個詞很大程度影響了下一個詞，需要用迴圈神經網路。（自然語言處理）

6-2

推導公式（6.40）和公式（6.41）中的梯度。
基本和（6.39）的公式一致。
主要差別在於Zk對於Uij和Zk對於Wij、Bij的偏導上。

6-3

原因：

其中6.34的誤差項為6-2中的德爾塔t,k
解決方法：
增加門控機制，例如：長短期記憶神經網路（LSTM）。

6-4（我透）

推導LSTM網路中引數的梯度，並分析其避免梯度消失的效果。

6-5（我透）

推導GRU網路中引數的梯度，並分析其避免梯度消失的效果。

6-6

增加深度的方法是：增加同一時刻網路輸入到輸出之間的路徑Xt->Yt（Xt->Ht或者Ht->Yt）
常見結構除了堆疊迴圈神經網路，還有雙向迴圈神經網路、遞迴神經網路、圖神經網路等。

6-7[..]

當遞迴神經網路的結構退化為線性序列結構時,遞迴神經網路就等價於簡單迴圈網路

神經網路與深度學習[邱錫鵬] 第六章習題解析

6-1 三者都是典型的神經網路模型。卷積神經網路是對前饋神經網路增加捲積層和池化層。

邱錫鵬神經網路與深度學習課程【十三】——無監督學習和概率圖模型1

無監督學習定義：只從無標籤的資料中學習出一些有用的模式典型的無監督學習：深度學習中只考慮前兩個問題即可

邱錫鵬神經網路與深度學習課程【十五】——概率圖模型2和3

學習：引數學習：給定一組訓練樣本，求解模型引數進行引數估計有向圖：在貝葉斯網路中，所有變數x的聯合概率分佈可以分解為每個隨機變數x_k的區域性條件概率的連乘形式

邱錫鵬神經網路與深度學習課程【十六】——深度信念網路

玻爾茲曼機：是一種特殊的概率無向圖模型如何推斷？因為分配函式Z通常都比較難以計算所以採用Gibbs取樣

數字影象處理day_8 神經網路與深度學習介紹

一. 從人工智慧開始通過複製一個人腦來實現人工智慧在目前階段是不切實際的，人工智慧是電腦科學的一個分支，主要研究、開發用於模擬、延伸和擴充套件人類智慧的理論、方法、技術及應用系統

白嫖! 2020最新版《神經網路與深度學習》中文版更新完畢，PDF免費開放下載~

介紹《神經⽹絡和深度學習》是⼀本免費的線上書，對讀者數學知識需求適度，兼顧理論和動手實踐。

《神經網路與深度學習》第四章前饋神經網路

第四章前饋神經網路人工神經網路（ANN）：指一系列受生物學和神經科學啟發的數學模型。簡稱為神經網路（NN）or神經模型。

[2022-12-06]神經網路與深度學習hw11 - 各種優化演算法比較

Override the entrypoint of an image Introduced in GitLab and GitLab Runner 9.4. Read more about the extended configuration options.

《動手學深度學習》mxnet版/第三章學習筆記

第三章從單層神經網路延伸到多層神經網路，並通過多層感知機引入深度學習模型

《動手學深度學習》mxnet版/第五章學習筆記

第五章描述卷積神經網路中卷積層和池化層的工作原理，並解釋填充、步幅、輸入通道和輸出通道的含義

《動手學深度學習》mxnet版/第四章學習筆記

第四章概括深度學習計算的各個重要組成部分，如模型構造、引數的訪問和初始化等，自定義層，讀取、儲存和使用GPU

NLP與深度學習（二）迴圈神經網路

1. 迴圈神經網路在介紹迴圈神經網路之前，我們先考慮一個大家閱讀文章的場景。一般在閱讀一個句子時，我們是一個字或是一個詞的閱讀，而在閱讀的同時，我們能夠記住前幾個詞或是前幾句的內容。這樣我們便能理解整個

深度學習基礎課：卷積神經網路與卷積層的前向傳播推導

大家好~本課程為“深度學習基礎班”的線上課程，帶領同學從0開始學習全連線和卷積神經網路，進行數學推導，並且實現可以執行的Demo程式

孿生網路：使用雙頭神經網路進行元學習

深度神經網路有一個大問題-他們一直渴望資料。當資料太少時（無法到達演算法可以接受的數量）深度神經網路很難推廣。這種現象突出了人類和機器認知之間的差距。人們可以通過很少的訓練示例來學習複雜的模

綜述|視覺與慣導，視覺與深度學習SLAM

點選上方“3D視覺工坊”，選擇“星標” 乾貨第一時間送達 SLAM包含了兩個主要的任務：定位與構圖，在移動機器人或者自動駕駛中，這是一個十分重要的問題：機器人要精確的移動，就必須要有一個環境的地圖，

迴圈神經網路與應用（案例還不錯）

迴圈神經網路與應用寒小陽 2018 - 0 8 主要內容 n 迴圈神經網路 1.場景與多種應用 2.層級結構 3.多種RNN 4.BPTT演算法

irca slam與深度學習結合論文總結

1 UnDeepVO: Monocular Visual Odometry through Unsupervised Deep Learning 文件存放名稱：1-UnDeepVO Abstract總結：本文提出一個新的VO系統，可以實現單目影象的6個自由度的姿態估計，主要亮點：（1）採

AlexNet網路的深度學習工具箱模型【Matlab】

用於影象分類的預訓練AlexNet網路模型 AlexNet是一個預先訓練的卷積神經網路（CNN），已經對來自ImageNet資料集（

機器學習與深度學習

典型的機器學習一般思路：預處理、特徵提取、特徵選擇、推理預測或者識別。深度學習能夠儘可能地使用演算法解決預處理、特徵提取、特徵選擇。

NLP與深度學習（六）BERT模型的使用

1. 預訓練的BERT模型從頭開始訓練一個BERT模型是一個成本非常高的工作，所以現在一般是直接去下載已經預訓練好的BERT模型。結合遷移學習，實現所要完成的NLP任務。谷歌在github上已經開放了預訓練好的不同大小的BE