動手學深度學習 | 網路中的網路NiN | 24

阿新 • • 發佈：2021-09-29

NiN
程式碼
QA

NiN

NiN Network in Network，網路中的網路，這個網路現在用的不多，幾乎很少被用到，但是它裡面提出了比較重要的一些概念，在後面很多網路中都會持續的被用到。

MLP其實是不錯的，但是缺點就是引數量實在是太大了！

卷積層的引數相對於MLP會少很多，而且\(1*1\)卷積是可以達到於MLP的相同效果。

引數多會帶來很多問題：一個是會佔用很多記憶體，一個是會佔用很多的計算頻寬，還有一個最重要的事情就是MLP的引數過多，非常容易導致模型的過擬合。

為了避免上述MLP帶來的問題，NiN的思想就是完全不要全連線層，而是使用\(1*1\)的卷積來替代。

NiN塊，VGG也有VGG塊，後面基本卷積神經網都有自己的區域性架構。

NiN無全連線層，最後使用一個全域性平均池化層得到輸出。

所謂的全域性池化層，就是池化層的高寬，是等於輸入的高寬，就等價對每個通道，把最大值給拿出來。當然一般要分多少類，那麼最後的輸出通道數就為多少。

NiN是包括最後也不使用MLP，這也是一個非常極端的一個設計。

程式碼

QA

為什麼這裡分類最後沒有使用softmax？

不是的，都是有使用softmax的，只不過softmax是寫在train函式之中。

softmax是有一個自己的計算公式的（就可以看做是一個模型），然後分類問題使用的交叉熵損失函式。

一個最簡潔的softmax模型是包含在Linear中的 net = nn.Sequential(nn.Flatten(),nn.Linear(784,10))

所以GAP不是去替代softmax，而是去替代全連線層。

GAP的設計是不是很關鍵？

這個設計思想給後面帶來了非常大的影響，後面大家發現這個東西，挺好用的。

GAP是沒有學習的引數的，它就是最後把輸出壓縮成(1,1)。可以理解成GAP的最大作用就是降低了模型的複雜性。使用GAP會大大提高模型的泛化性。

但是GAP的一個缺點就是會讓收斂變的很慢，反過來看，之所以AlexNet那些可以收斂的那麼快，是因為最後的那兩個MLP太厲害了，可以很好的進行資料的擬合。也就是AlexNet和VGG一般epoch=50即可，但是NiN可能epoch=120，這樣掃多幾次讓其收斂。

絕大部分時候，訓練久一點不要緊，精度好才是關鍵。

為什麼NiN是使用了2個\(1*1\)的卷積，而不是3個？

沐神認為是試出來...

動手學深度學習 | 殘差網路 ResNet | 27

目錄ResNet程式碼QA ResNet 如果說CNN只要你連線一個網路的話，那麼只要連線ResNet就可以了。ResNet是一個很簡單的，也是一個很好用的網路。

動手學深度學習 | 網路中的網路NiN | 24

目錄NiN程式碼QA NiN NiN Network in Network，網路中的網路，這個網路現在用的不多，幾乎很少被用到，但是它裡面提出了比較重要的一些概念，在後面很多網路中都會持續的被用到。

動手學深度學習 | 雙向迴圈神經網路 | 59

目錄雙向迴圈神經網路程式碼QA 雙向迴圈神經網路雙向LSTM非常不適合做推理，基礎是不能用在預測下一個詞。

動手學深度學習基礎

第一次作業：深度學習基礎 1. 影象處理基本練習展示不同通道上的影象 # 展示三通道影象

《動手學深度學習》mxnet版/第三章學習筆記

第三章從單層神經網路延伸到多層神經網路，並通過多層感知機引入深度學習模型

《動手學深度學習》mxnet版/第五章學習筆記

第五章描述卷積神經網路中卷積層和池化層的工作原理，並解釋填充、步幅、輸入通道和輸出通道的含義

《動手學深度學習》mxnet版/第四章學習筆記

第四章概括深度學習計算的各個重要組成部分，如模型構造、引數的訪問和初始化等，自定義層，讀取、儲存和使用GPU

《動手學深度學習Pytorch版》之AlexNet預測結果展示

技術標籤：Pytorch深度學習python深度學習《動手學深度學習Pytorch版》https://github.com/ShusenTang/Dive-into-DL-PyTorch 為了檢視預測結果，在原Demo上加了預測顯示程式碼。注意：

《動手學深度學習》(TF2.0版)第二章

技術標籤：深度不學習第二章 import tensorflow as tf print(tf.__version__) 檢視TF的版本 2.2資料操作

動手學深度學習影象分類例項-多層感知機(三) 多層感知機的簡潔實現

技術標籤：深度學習深度學習神經網路機器學習人工智慧python 動手學深度學習影象分類例項-多層感知機(三) 多層感知機的簡潔實現

動手學深度學習 | 目錄 | 00

動手學深度學習 | 資料操作+資料預處理 | 02

目錄資料操作資料操作實現資料預處理實現QA 資料操作圖片是三維的： w*h*channel

動手學深度學習 | 線性代數 | 03

目錄線性代數線性代數實現按特定軸求和QA 線性代數其實我們不需要太多線性代數的知識，但是還是稍微講一下作為一個數學上的入門。

動手學深度學習 | Softmax迴歸+損失函式+圖片分類資料集 | 07

目錄Softmax迴歸損失函式圖片分類資料集Softmax迴歸從零開始實現Softmax迴歸簡潔實現QA

動手學深度學習 | 多層感知機+程式碼實現 | 08

目錄感知機多層感知機多層感知機從零開始實現多層感知機簡潔實現QA 感知機

動手學深度學習 | 模型選擇+過擬合和欠擬合 | 09

目錄模型選擇過擬合和欠擬合QA 模型選擇我們其實關心的是泛化誤差，並不太關心訓練誤差。

動手學深度學習 | 使用和購買GPU | 15

目錄使用GPU購買GPU整機配置QA 使用GPU 其實如果沒有錢買GPU的話，使用Google Colab也是一個不錯的選擇，大概是10 dollar一個月。

動手學深度學習 | 預測房價競賽總結 | 16

目錄競賽總結QA 競賽總結我們講知識，也不可能所有東西都cover到，讓大家競賽不是讓大家去學某個特定的知識，而是說大家遇到一個問題，怎麼去找一個解決方案。這一次的解決方案和下一次的會不一樣，但是問題是你

動手學深度學習 | 語言模型 | 53

目錄語言模型程式碼QA 語言模型一隻猴子打字，就算是打到宇宙毀滅，他也打不出莎士比亞的文章。

動手學深度學習安裝環節

以下均在linux中執行，建議學習的同學都選擇ununtu18.0以上版本OS。 1.minicanda的安裝：

動手學深度學習 | 網路中的網路NiN | 24

NiN

程式碼

QA

相關推薦