opencv(python)使用ann神經網路識別手寫數字

阿新 • • 發佈：2020-12-27

opencv中也提供了一種類似於Keras的神經網路，即為ann，這種神經網路的使用方法與Keras的很接近。
關於mnist資料的解析，讀者可以自己從網上下載相應壓縮檔案，用python自己編寫解析程式碼，由於這裡主要研究knn演算法，為了圖簡單，直接使用Keras的mnist手寫數字解析模組。
本次程式碼執行環境為：
python 3.6.8
opencv-python 4.4.0.46
opencv-contrib-python 4.4.0.46

下面的程式碼為使用ann進行模型的訓練：

from keras.datasets import 
 mnist
from keras import utils
import cv2
import numpy as np

#opencv中ANN定義神經網路層
def create_ANN():
    ann=cv2.ml.ANN_MLP_create()
    #設定神經網路層的結構 輸入層為784 隱藏層為60 輸出層為10
    ann.setLayerSizes(np.array([784,60,10]))
    #設定網路引數為誤差反向傳播法
    ann.setTrainMethod(cv2.ml.ANN_MLP_BACKPROP)
    #設定啟用函式為sigmoid
    ann. 
setActivationFunction(cv2.ml.ANN_MLP_SIGMOID_SYM)
    #設定訓練迭代條件 
    #結束條件為訓練30次或者誤差小於0.00001
    ann.setTermCriteria((cv2.TermCriteria_EPS|cv2.TermCriteria_COUNT,300,0.0001))

    return ann

#計算測試資料上的識別率
def evaluate_acc(ann,test_images,test_labels):
    #採用的sigmoid啟用函式，需要對結果進行置信度處理 
    #對於大於0.99的可以確定為1 對於小於0.01的可以確信為0 


    test_ret=ann.predict(test_images)
    #預測結果是一個元組
    test_pre=test_ret[1]
    test_pre[test_pre>=0.7]=1
    test_pre[test_pre<=0.3]=0
    true_sum=(test_pre==test_labels)
    true_sum=true_sum.sum(axis=1)
    acc=(true_sum==10)
    return acc.mean()


if __name__=='__main__':
    #直接使用Keras載入的訓練資料(60000, 28, 28) (60000,)
    (train_images,train_labels),(test_images,test_labels)=mnist.load_data()
    #變換資料的形狀並歸一化
    train_images=train_images.reshape(train_images.shape[0],-1)#(60000, 784)
    train_images=train_images.astype('float32')/255

    test_images=test_images.reshape(test_images.shape[0],-1)
    test_images=test_images.astype('float32')/255

    #將標籤變為one-hot形狀 (60000, 10) float32
    train_labels=utils.to_categorical(train_labels)
    test_labels=utils.to_categorical(test_labels)
    
    #定義神經網路模型結構
    ann=create_ANN()

    #開始訓練    
    ann.train(train_images,cv2.ml.ROW_SAMPLE,train_labels)
    #在測試資料上測試準確率
    print(evaluate_acc(ann,test_images,test_labels))
    
    #儲存模型
    ann.save('minist_ann.xml')
    #載入模型
    myann=cv2.ml.ANN_MLP_load('minist_ann.xml')

訓練300次得到的準確率為0.9058，可以接著增加訓練次數或者提高神經網路的層次結構深度來提高準確率。
使用ann神經網路的模型結構非常小，因為只是儲存了權重引數。
在這裡插入圖片描述
可以看到整個模型檔案的大小才1M，而svm的大小為十多兆，knn的為幾百兆，因此使用ann神經網路更加適合部署在客戶端上。
接下來使用ann進行圖片的測試識別：

import cv2
import numpy as np

if __name__=='__main__':
    #讀取圖片
    img=cv2.imread('shuzi.jpg',0)
    img_sw=img.copy()

    #將資料型別由uint8轉為float32
    img=img.astype(np.float32)
    #圖片形狀由(28,28)轉為(784,)
    img=img.reshape(-1,)
    #增加一個維度變為(1,784)
    img=img.reshape(1,-1)
    #圖片資料歸一化
    img=img/255

    #載入ann模型
    ann=cv2.ml.ANN_MLP_load('minist_ann.xml')
    #進行預測
    img_pre=ann.predict(img)
    #因為啟用函式sigmoid，因此要進行置信度處理
    ret=img_pre[1]
    ret[ret>0.9]=1
    ret[ret<0.1]=0
    print(ret)

    cv2.imshow('test',img_sw)
    cv2.waitKey(0)

執行程式，結果如下，可見該模型正確識別了數字0.
在這裡插入圖片描述

opencv(python)使用ann神經網路識別手寫數字

opencv(python)使用ann神經網路識別手寫數字

opencv(python)使用svm演算法識別手寫數字

尋找利用神經網路識別手寫資料集MNIST程式的最佳引數（learning_rate、nodes、epoch）

BP神經網路實現手寫數字識別

前饋神經網路實現手寫數字識別

opencv(python)使用knn最近鄰演算法識別手寫數字

19神經網路實現手寫識別

多層全連線網路實現手寫數字識別（PyTorch）

Python實現識別手寫數字 Python圖片讀入與處理

機器學習實戰2-2KNN識別手寫數字

使用cnn網路訓練手寫數字資料集

4.2tensorflow多層感知器MLP識別手寫數字最易懂例項程式碼

2.3測試演算法：使用k-近鄰演算法識別手寫數字

python神經網路程式設計實現手寫數字識別

【tensorflow】搭建手寫數字識別神經網路模型：Sequential() / 神經網路類class 兩種方法

利用卷積神經網路識別mnist手寫數字

tensorflow2.3 通過卷積神經網路_mnist資料手寫數字識別功能

用Keras實現MNIST手寫數字識別（使用CNN:卷積神經網路）

機器學習——用卷積神經網路（CNN）實現手寫數字識別

【手寫數字識別】基於matlab GUI BP神經網路手寫數字識別【含Matlab原始碼 1118期】

opencv(python)使用ann神經網路識別手寫數字

相關推薦