深度學習下海血淚史【1】AlexNet回顧

阿新 • • 發佈：2018-12-17

0 摘要

Hinton大神（BP演算法提出者）的學生Alex提出於2012年，主要創新和貢獻為【1】首次利用GPU和ReLU加快訓練【2】使用dropout減少過擬合【3】提出LRN層和重疊最大池化（max pooling）

AlexNet一舉奪得視覺領域競賽ILSVRC 2012的桂冠，在ImageNet資料集合上，效果遠超過傳統的方法，從傳統的70%多提升到80%多。

1 網路架構

AlexNet共有八層網路在這裡插入圖片描述 5層卷積層，3層全連線層，引數數量60M，神經元個數650k，分類數目1000類

網路層	感受野	卷積核個數	卷積核尺寸	步長	padding	feature_map
conv1	227*227	48*2	11113	4	2	227*227
max pooling	55*55	48*2	333	2	-	56*56
conv2	27*27	48*2	5548	1	2	27*27
max pooling	25*25	128*2	3348	2	-	27*27
conv3	12*12	192*2	33128	1	1	13*13
conv4	10*10	192*2	33192	1	1	13*13
conv5	8*8	128*2	33192	1	1	13*13
max pooling	6*6	128*2	33128	2	-	6*6
fc1	-	2048*2	66256	-	-	-
fc2	-	2048*2	114096	-	-	-
fc3	-	1000	114096	-	-	-

1.1 ReLU

f(x)= max(0,x) 1、與使用tanh相比ReLUs能以6倍快的速度到達25%的訓練錯誤率（CIFAR-10資料集）。 2、解決了sigmoid在網路層次較深時的梯度彌散問題。

1.2 Overlap Max pooling

f(x)= max(0,x) Pooling的步長stride比Kernel Size要小，重疊池化視窗能夠分別將第一名的錯誤率降低0.4%，第5名的錯誤率降低0.3%

1.3 減少過擬合

1.3.a 資料增強（data augmentation）

方法一：水平翻轉和影象變換方法二：PCA Jittering

1.3.b Dropout

訓練時使用Dropout隨機忽略一部分神經元，以避免模型過擬合。樸素思想：以0.5的概率讓隱藏層的輸出為0，失活的神經元不再進行前向傳播且不參與反向傳播 AlexNet：前兩個全連線層使用dropout，會減少過擬合，但會使訓練迭代次數翻一倍

1.4 LRN（區域性響應歸一化）

提出了LRN層，對區域性神經元的活動建立競爭機制，使得其中響應比較大的值變得相對更大，並抑制其他反饋較小的神經元，增強了模型的泛化能力。在後來的設計中，這一層已經被諸如Regularization技術，如drop out, batch normalization取代了。

2 後續發展

1）全連線層的替換（使用全卷積來進行替換） 2）卷積核大小的修改（類似inception） 3）通道分組卷積（類似shufflenet） 4）通道、權重剪枝（類似Channel pruing） 5）LRN被batch normalization等泛化增強技術替代

3 附錄

感受野計算公式(不考慮padding,從下往上反推) rfsize = (output - 1) * stride + ksize

Feature Map的尺寸計算公式 fm(output)=(input_size + 2 * padding_size − ksize)/stride+1

卷積核的厚度=被卷積的影象的通道數（卷積後三通道合為1）卷積核的個數=卷積操作後輸出的通道數（即feature map的通道數）全連線概念拿第一層全連線層舉例，該操作其實就是用2048個13*13 *256（256是池化層的厚度）的卷積核卷積出來的，對於輸入的每一張特徵圖，都使用一個和影象大小一樣的核卷積進行點積運算，這樣整幅圖就變成了一個數了，如果厚度是256就是那256個核卷積完了之後相加求和。這樣就能把一張圖高度濃縮成一個數了。

深度學習下海血淚史【1】AlexNet回顧

0 摘要

1 網路架構

1.1 ReLU

1.2 Overlap Max pooling

1.3 減少過擬合

1.3.a 資料增強（data augmentation）

1.3.b Dropout

1.4 LRN（區域性響應歸一化）

2 後續發展

3 附錄

深度學習下海血淚史【1】AlexNet回顧

深度學習下海血淚史【2】VGG回顧

Linux學習之命令【1】

openCV學習之路【1】---VS2017+openCV3.4.1配置教程

第四章了不起的分支和迴圈[DDT書本學習小甲魚]【1】

第五章列表、元組和字串[DDT書本學習小甲魚]【1】

第五章列表、元組和字符串[DDT書本學習小甲魚]【1】

Step 14: p5.js 程式設計基礎學習合集【1】

第十章圖形用戶界面入門[DDT書本學習小甲魚]【1】

第十章圖形使用者介面入門[DDT書本學習小甲魚]【1】

第六章函數[DDT書本學習小甲魚]【1】

第七章字典和集合[DDT書本學習小甲魚]【1】

第八章永久存儲[DDT書本學習小甲魚]【1】

Qt學習之路【1】：QT顯示中文問題

ZooKeeper學習之配置【1】基本配置

機器學習和深度學習資料彙總【02】

【讀書1】【2017】MATLAB與深度學習——消失的梯度(1)

【讀書1】【2017】MATLAB與深度學習——過度擬合(1)

【讀書1】【2017】MATLAB與深度學習——示例：MNIST(1)

【讀書1】【2017】MATLAB與深度學習——池化層(1)

深度學習下海血淚史【1】AlexNet回顧

0 摘要

1 網路架構

1.1 ReLU

1.2 Overlap Max pooling

1.3 減少過擬合

1.3.a 資料增強（data augmentation）

1.3.b Dropout

1.4 LRN（區域性響應歸一化）

2 後續發展

3 附錄

相關推薦