CNN+tensorflow實現識別圖片

阿新 • • 發佈：2018-12-14

原文地址原文的原文出自知乎。轉載來主要是做一個筆記，便於每次檢視。

通過一個影象分類問題介紹卷積神經網路是如何工作的。下面是卷積神經網路判斷一個圖片是否包含“兒童”的過程，包括四個步驟： ● 影象輸入（InputImage） ● 卷積（Convolution） ● 最大池化（MaxPooling） ● 全連線神經網路（Fully-ConnectedNeural Network）計算。在這裡插入圖片描述首先將圖片分割成如下圖的重疊的獨立小塊；下圖中，這張照片被分割成了77張大小相同的小圖片。接下來將每一個獨立小塊輸入小的神經網路；這個小的神經網路已經被訓練用來判斷一個圖片是否屬於“兒童”類別，它輸出的是一個特徵陣列。在這裡插入圖片描述

標準的數碼相機有紅、綠、藍三個通道（Channels），每一種顏色的畫素值在0-255之間，構成三個堆疊的二維矩陣；灰度影象則只有一個通道，可以用一個二維矩陣來表示。將所有的獨立小塊輸入小的神經網路後，再將每一個輸出的特徵陣列按照第一步時77個獨立小塊的相對位置做排布，得到一個新陣列。在這裡插入圖片描述

第二步中，這個小的神經網路對這77張大小相同的小圖片都進行同樣的計算，也稱權重共享（SharedWeights）。這樣做是因為，第一，對影象等陣列資料來說，區域性陣列的值經常是高度相關的，可以形成容易被探測到的獨特的區域性特徵；第二，影象和其它訊號的區域性統計特徵與其位置是不太相關的，如果特徵圖能在圖片的一個部分出現，也能出現在任何地方。所以不同位置的單元共享同樣的權重，並在陣列的不同部分探測相同的模式。數學上，這種由一個特徵圖執行的過濾操作是一個離散的卷積，卷積神經網路由此得名。在這裡插入圖片描述

卷積步驟完成後，再使用MaxPooling演算法來縮減畫素取樣陣列，按照2×2來分割特徵矩陣，分出的每一個網格中只保留最大值陣列，丟棄其它陣列，得到最大池化陣列（Max-PooledArray）。接下來將最大池化陣列作為另一個神經網路的輸入，這個全連線神經網路會最終計算出此圖是否符合預期的判斷。在這裡插入圖片描述

在實際應用時，卷積、最大池化和全連線神經網路計算，這幾步中的每一步都可以多次重複進行，總思路是將大圖片不斷壓縮，直到輸出單一的值。使用更多卷積步驟，神經網路就可以處理和學習更多的特徵。

CNN+tensorflow實現識別圖片

CNN+tensorflow實現識別圖片

c#實現識別圖片上的驗證碼數字

卷積神經網路CNN:Tensorflow實現(以及對卷積特徵的視覺化)

CNN tensorflow 人臉識別

Faster R-CNN Tensorflow實現之資料集製作（2）--- xml檔案的讀寫修改

keras與卷積神經網路（CNN）實現識別minist手寫數字

字元型圖片驗證碼，使用tensorflow實現卷積神經網路，進行驗證碼識別CNN

2.CNN圖片多標籤分類（基於TensorFlow實現驗證碼識別OCR）

Tensorflow實現CNN用於MNIST識別

1.CNN圖片單標籤分類（基於TensorFlow實現基礎VGG16網路）

tensorflow 12：雙隱層+softmax迴歸實現mnist圖片識別之二

深度學習框架Tensorflow學習--CNN實現識別數字

6 TensorFlow實現cnn識別手寫數字

【深度學習影象識別課程】tensorflow實現CNN系列：（1）概念介紹

tensorflow實現CNN識別手寫數字

tensorflow實現基於KNN（和CNN）演算法的阿拉伯數字識別（程式碼詳解）

Tensorflow實現Mask R-CNN實例分割通用框架，檢測，分割和特征點定位一次搞定（多圖）

學習筆記TF024:TensorFlow實現Softmax Regression(回歸)識別手寫數字

94、tensorflow實現語音識別0,1,2,3,4,5,6,7,8,9

利用Tensorflow實現手寫字符識別

CNN+tensorflow實現識別圖片

相關推薦