卷積神經網路（CNN）基礎

阿新 • • 發佈：2021-07-21

Padding and stride

一個N*N的影象，使用f*f的卷積核，會得到（n-f+1）*（n-f+1）的大小

但是邊緣的影象使用了一次，而且整個影象縮小了

因此，可以增加一圈padding，假設增加的padding 的長度為p

會得到（n+2p-f+1）*（n+2p-f+1）的影象

通常由兩種卷積方式

“Valid”：不填充

“Same”：填充2p，使得輸入輸出相同大小

（n+2p-f+1）==n→2p+1-f==0→p=（f-1）/2

所以f通常情況下為奇數

如果加入了Stride

那麼輸出的影象大小就變成[（n+2p-f）/s+1]* [（n+2p-f）/s+1]

//n+2p-f 剩餘長度 /s 移動個數 +1 初始位置

如果除法（n+2p-f）/s不是一個整數，一般向下取整數，即放棄最後一個不完全的框

三維卷積

計算方式：對應位置的數字相乘，將乘積的和放在對應的位置

可以為三個通道的過濾器，設定不同的過濾器，但是過濾器的通道數必須和原圖一樣

我們可以設定多個過濾器，例如相對Red層即檢測垂直邊界，又檢測水平邊界，那麼我們可以選擇通過兩個立體過濾器，如下圖中，橙色和黃色為不同的過濾器，將結果組合，就得到下一層的輸入

Summary：

N*N*n_channels * f*f*n_channels → （n-f+1）*（n-f+1）*number of n_channels

6*6*3 3*3*3 4 * 4 * 2

單層卷積網路

Input: N_h^[l-1]* N_w^[l-1]*N_c^[l-1] width*height*channels_num in layer l-1

Output: N_h^[l]* N_w^[l]*N_c^[l] width*height*channels_num in layer l

Each filter is: f^[l]*f^[l]*N_c^[l-1] f*f* channels_num in layer l-1

Activations: a^[l]= N_h^[l]* N_w^[l]*N_c^[l] A^[l]= m*N_h^[l]* N_w^[l]*N_c^[l]

Weight: Each filter * filter_num f^[l]

*f^[l]*N_c^[l-1]*N_c^[l]

Bias: (1,1,1,N_c^[l]) 橫向排列組合的一排小立方體

為什麼使用卷積

卷積可以減少引數量

引數共享

同一個卷積核可以在不同區域中使用，例如垂直邊界卷積核可以在多次使用

稀疏連結

每一層中的輸出僅僅和上一層中的幾個引數相關，例如一個3*3的filter僅僅涉及9個引數

池化

特殊的過濾器，對一個塊內的資訊做不同的操作，eg，max、average，

Hyperparameter超參：filter size、stride

全連線

引數=filter_size*filter_size+bias || Activation size^(L-1)*Actication size^(L)+bias 偏置一般就是1

卷積神經網路（CNN）基礎

Padding and stride 一個N*N的影象，使用f*f的卷積核，會得到（n-f+1）*（n-f+1）的大小

使用卷積神經網路（CNN）做人臉識別的示例程式碼

上回書說到了對人臉的檢測，這回就開始正式進入人臉識別的階段。關於人臉識別，目前有很多經典的演算法，當我大學時代，我的老師給我推薦的第一個演算法是特徵臉法，原理是先將影象灰度化，然後將影象每行首尾相接拉

深度學習筆記二：卷積神經網路（CNN）

卷積神經網路CNN 1. 緒論 1. 卷積神經網路的應用基本應用：分類、檢索、檢測、分割

吳恩達深度學習筆記（deeplearning.ai）之卷積神經網路（CNN）（上）

原文連結 https://www.cnblogs.com/szxspark/p/8439066.html 1. Padding 在卷積操作中，過濾器（又稱核）的大小通常為奇數，如3x3，5x5。這樣的好處有兩點：

機器學習——用卷積神經網路（CNN）實現手寫數字識別

原文連結：https://data-flair.training/blogs/python-deep-learning-project-handwritten-digit-recognition/

卷積神經網路（CNN）

1. 卷積神經網路結構介紹如果用全連線神經網路處理大尺寸影象具有三個明顯的缺點：

圖聚類到圖卷積神經網路（一）

圖資料（0,1板塊）目錄： 0、引入 1、圖資料 1.1 何為圖資料 1.2 圖相關的理論鋪墊

概覽經典卷積神經網路（LeNet、AlexNet、VggNet、GoogLeNet、SqueezeNet、SqueezeNet、ResNet、DenseNet、DarkNet、ShuffleNe）

LeNet LeNet誕生於1994年，由深度學習三巨頭之一的Yan Lecun提出，他也被稱為卷積神經網路之父。

卷積神經網路CNN（一）

　　我們將先描述卷積神經⽹絡中卷積層和池化層的⼯作原理，並解釋填充、步幅、輸⼊通道和輸出通道的含義。掌握了這些基礎知識以後，我們將探究數個具有代表性的深度卷積神經⽹絡的設計思路。

用Keras實現MNIST手寫數字識別（使用CNN:卷積神經網路）

https://github.com/jelly-lemon/keras_mnist_0112 用Keras實現MNIST手寫數字識別 MNIST手寫數字資料集介紹

Pytorch實現基於卷積神經網路的面部表情識別(詳細步驟)（轉載）

文章目錄　　一、專案背景　　二、資料處理　　　　1、標籤與特徵分離　　　　2、資料視覺化　　　　3、訓練集和測試集　　三、模型搭建　　四、模型訓練　　五、完整程式碼

基於FPGA的卷積神經網路實現（七）卷積模組

將卷積展開後要進行的運算實質上是大規模矩陣運算，因此卷積模組的實現時最容易的，什麼都不需要考慮，資料按順序來了就計算，而這個順序是資料讀取部分需要考慮的，計算完了輸出去這部分是下一層的資料資料

入門卷積神經網路學習（一）：卷積層

卷積層當一個深度神經網路以卷積層為主體時，我們稱為卷積神經網路。卷積運算：

3.2 CNN卷積神經網路基礎知識-卷積操作(百度架構師手把手帶你零基礎實踐深度學習原版筆記系列)

入門卷積神經網路學習（三）啟用函式

什麼是啟用函式輸入訊號的總和會被函式h(x)轉換，轉換後的值就是輸出y。函式h(x)就被稱為啟用函式。舉個例子：輸入訊號x1,x2.經過權重w1,w2偏置b的計算總和為a.a通過啟用函式h()輸出y.

入門卷積神經網路(四）誤差函式（損失函式）

誤差函式（損失函式）監督學習的神經網路需要一個函式來測度模型的輸出值p和真實因變數值y之間的差異，一般這種差異被稱為殘差或者誤差。

聯邦學習論文研究（基於卷積神經網路的聯邦學習演算法研究）

聯邦學習綜述三大研究方向：聯邦優化演算法、通訊開銷和隱私保護。聯邦優化演算法：非獨立同分布且不平衡的隱私性資料，資料集分佈在不同的客戶端上且不可以直接獲取，客戶端本身特徵導致資料非獨立同分布性。客

基於 SoC 的卷積神經網路車牌識別系統設計（1）概述

NOTES：這是第三屆全國大學生積體電路創新創業大賽 - Arm 杯 - 片上系統設計挑戰賽（本人指導的一個比賽）。主要劃分為以下的 Top5 重點、難點、亮點、熱點以及創新點。

python人臉識別專案之學習筆記（五）：卷積神經網路

1. 卷積神經網路卷積神經網路（Convolutional Neural Network）簡稱CNN，CNN是所有深度學習課程、書籍必教的模型，CNN在影像識別方面的為例特別強大，許多影像識別的模型也都是以CNN的架構為基礎去做延伸。

卷積神經網路相關（1）：卷積神經網路模型的引數量Params和計算量FLOPs簡單程式碼

文章目錄概述一、利用torchstat　　1.1 方法　　1.2 程式碼　　1.3 輸出二、利用ptflops　　2.1 方法　　2.2 程式碼　　2.3 輸出三、利用thop　　3.1 方法　　3.2 程式碼　　3.3 輸出概述　　Params：是指網路模型中

卷積神經網路（CNN）基礎

Padding and stride

三維卷積

單層卷積網路

為什麼使用卷積

引數共享

稀疏連結

池化

全連線

相關推薦