卷積神經網路筆記（一）

阿新 • • 發佈：2018-12-22

1.採用小尺寸卷積，如3X3，1X1，假設所有的資料有C個通道，那麼單獨7*7卷積層將含有C*（7*7*C）=49C^2個引數，而3個3*3的卷積層僅有3*（C*（3*3*C））=27C^2個引數。假設所有的資料有C個通道，這句話的意思是說卷積前後都是C個特徵圖，即有C個卷積核。對於3X3的卷積核，則為連續三層，每層C個。
2.函式的飽和度：指輸入與輸出的關係，如果輸出不變，將導致梯度為0（附加效果），可以理解為飽和區域的梯度為0，非飽和區域的梯度不總是接近0（可以恆為n），如sigmoid函式與relu函式。
3.學習率
loss不下降，學習率太小
loss爆炸，學習率太大，出現Nan時，就是學習率太大
4.在訓練模型的時候，通常會遇到這種情況：我們平衡模型的訓練速度和損失（loss）後選擇了相對合適的學習率（learning rate），但是訓練集的損失下降到一定的程度後就不在下降了，比如training loss一直在0.7和0.9之間來回震盪，不能進一步下降。如下圖所示（借圖一用）：

![image.png](https://upload-images.jianshu.io/upload_images/8035477-6b0261097f917791.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

　　遇到這種情況通常可以通過適當降低學習率（learning rate）來實現。但是，降低學習率又會延長訓練所需的時間。
　　學習率衰減（learning rate decay）就是一種可以平衡這兩者之間矛盾的解決方案。學習率衰減的基本思想是：學習率隨著訓練的進行逐漸衰減。
　　學習率衰減基本有兩種實現方法：
1. 線性衰減。例如：每過5個epochs學習率減半
2. 指數衰減。例如：每過5個epochs將學習率乘以0.1
5.在計算誤差的時候，不直接使用差值，而使用差值的平方和(可以排除符號的干擾，僅關注差異)（借圖一用）
![image.png](https://upload-images.jianshu.io/upload_images/8035477-40381126e61d6d1b.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

除以2是為了後面求梯度的時候方便，除以m是做一個平均的量化。上面的式子稱為均方差

卷積神經網路筆記（一）

卷積神經網路筆記（一）

卷積神經網路理解（一）：濾波器的意義

深度卷積神經網路學習（一）

卷積神經網路記錄（一）基礎知識整理

卷積神經網路CNN（一）基本概念、卷積

卷積神經網路學習（一）——基本卷積神經網路搭建

卷積神經網路——卷積神經網路基礎（9）

卷積神經網路CNN（1）——影象卷積與反捲積（後卷積，轉置卷積）

深度學習之卷積神經網路入門（2）

卷積神經網路CNN（3）—— FCN(Fully Convolutional Networks)要點解釋

卷積神經網路CNN（8）—— Pix2Pix Application -- Aerialmap Lane Line Detection (Pix2Pix應用：航拍圖車道線檢測)

深度學習（十五）卷積神經網路CNN（3）---區域性連線

機器學習筆記（十三）：TensorFlow實戰五（經典卷積神經網路： LeNet -5 ）

《TensorFlow：實戰Google深度學習框架》——6.2 卷積神經網路簡介（卷積神經網路的基本網路結構及其與全連線神經網路的差異）

深度學習 --- 卷積神經網路CNN（LeNet-5網路學習演算法詳解）

深度學習 --- 卷積神經網路CNN（LeNet-5網路詳解）

[DeeplearningAI筆記]卷積神經網路4.11一維和三維卷積

機器學習演算法篇--卷積神經網路基礎（Convolutional Neural Network）

卷積神經網路實戰（視覺化部分）——使用keras識別貓咪

卷積神經網絡學習（一）

卷積神經網路筆記（一）

相關推薦