opencv舌頭監測模型+keras神經網路（LeNet）

阿新 • • 發佈：2019-02-14

基於前面使用opencv實現舌頭模型檢測後，本次主要針對模型引數調優，提高圖片識別率。

之前的模型精準率很高，但召回率不一定為1，有時候舌頭圖片並沒有被圈出。所以我們需要調整引數讓模型吧舌頭都識別出來，再通過LeNet模型做後續識別，將不是舌頭的剔除掉。

首先修改opencv訓練後的模型引數，調低scaleFactor值，讓模型更敏感，圈出更多的圖片（舌頭+額外的其他非舌頭圖片）

在預設引數(scaleFactor=1.38, minNeighbors=4, minSize=(20,20),)下,

Cascades模型的識別率偏低但精度高，

在該引數下，在資料規模為500的測試集中，一共切割出

446張小圖，覆蓋了500張圖片中的398張圖片，剩餘的48張小圖為識別錯誤圖片，或冗餘圖片。

修改為：(scaleFactor=1.002,, minNeighbors=3, minSize=(3,3),),

在該引數下，在資料規模為500的測試集中，一共切割出4823張小圖，覆蓋了500張圖片中的499張圖片，剩餘的4324張小圖為識別錯誤圖片，或冗餘圖片。

對比發現，前者的精準率很高，但召回率低於後者。所以我們在加上LeNet模型對後者進行再次過來篩選。

收集整理資料集

在上一個步驟中，我們通過Cascades演算法共獲得4823切割後的小圖，首先我們需要人工把這些圖片分為正樣本（是舌頭）和圖樣本（非舌頭）。

考慮到後期神經網路模型的計算量,在載入資料時，我們會將圖片標化為200 * 200的灰度圖片，分完後的效果如下：

正樣本:

負樣本:

構建卷積神經網路並訓練

為了提高模型的判別準確率，我們構建了一個深度為15層的卷積神經網路，

卷積網路的輸入是以200 * 200 的灰度圖片，輸出是一個0-1之前的值，該值是一個概率值，

import cv2
import os
import numpy as np
import tensorflow as tf

import keras.backend as K
from keras.datasets import mnist
from keras.layers import *
from keras.models import *
from keras.optimizers import *
from keras.initializers import *
from keras.callbacks import *
from keras.utils.vis_utils import plot_model#顯示層級圖
from tqdm import tqdm


def loadGrayImg(path, shape=(200, 200, 1)):
    """
    獲取灰度值圖片
    :param path:
    :return:
    """
    img = cv2.imread(path)
    img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    img = cv2.resize(img, (shape[0], shape[1]))
    return np.reshape(img, shape)


def loadData(dir, shape=(200, 200, 1)):
    """
    載入資料集
    :param dir:
    :return:
    """
    imgs = []
    for fn in os.listdir(dir):
        if fn.endswith('jpg'):
            imgs.append(loadGrayImg(os.path.join(dir, fn), shape=(200, 200, 1)))
    return np.array(imgs)#轉換為numpy矩陣


def net():
    """卷及網路模型"""
    inputs = Input(shape=(200, 200, 1))
    model = Lambda(lambda x: (x - 127.5) / 127.5)(inputs)#將畫素值變為（-1，-1）----灰度值是從0-255
    #卷積層--16個特徵圖，關機過濾器（5*5）,步長2*2，特徵圖大小：（200-5+2）/2=98
    model = Conv2D(16, 5, strides=(2, 2))(model)
    #啟用層--高階啟用層Advanced Activation-----LeakyReLU層，LeakyRelU是修正線性單元（Rectified Linear Unit，ReLU）的特殊版本，當不啟用時，
    # LeakyReLU仍然會有非零輸出值，從而獲得一個小梯度，避免ReLU可能出現的神經元“死亡”現象。即，f(x)=alpha * x for x < 0, f(x) = x for x>=0

    #  sigmoid和tanh在x趨於無窮的兩側，都出現導數為0的現象，成為軟飽和啟用函式。也就是造成梯度消失的情況，從而無法更新網路狀態。
  # relu的主要特點就是：單側抑制，相對寬闊的興奮邊界，稀疏啟用性。稀疏啟用性，是指使得部分神經元輸出為0，造成網路的稀疏性，
  #緩解過擬合現象。但是當稀疏過大的時候，出現大部分神經元死亡的狀態，因此後面還有出現改進版的prelu.就是改進左側的分佈
    model = LeakyReLU()(model)
    #池化層----輸出49*49*16
    model = MaxPooling2D(strides=2)(model)
    #卷積層---32個特徵圖，（49-5+2）/2=23-------輸出23*23*32
    model = Conv2D(32, 5, strides=(2, 2))(model)
    #啟用層
    model = LeakyReLU()(model)
    #池化層--輸出11*11*32
    model = MaxPooling2D(strides=2)(model)
    #卷積層--64個特徵圖feature map，輸出(11-5+2)/2=4*4*64
    model = Conv2D(64, 5, strides=(2, 2))(model)
    #啟用層
    model = LeakyReLU()(model)
    #池化層---輸出2*2*64
    model = MaxPooling2D(strides=2)(model)
    #展開層--輸出256
    model = Flatten()(model)
    #drop層，預設0.5最好
    model = Dropout(0.2)(model)
    #全連線層，壓縮為需要的維度128，如果本層的輸入資料的維度大於2，則會先被壓為與kernel相匹配的大小。
    model = Dense(128)(model)
    # 全連線層，壓縮為需要的維度128
    model = Dense(units=1, activation='sigmoid')(model)#使用simgod輸出0-1之間的值 ，二分類
    #生成模型
    model = Model(inputs=inputs, outputs=model)
    #執行模型，開始訓練
    model.compile(optimizer='nadam', loss='binary_crossentropy', metrics=['accuracy'])
    return model


def train(echos=500, batch_size=128):
    """訓練模型"""
    model = net()
    model.summary()
    plot_model(model, show_shapes=True, show_layer_names=True)

    positive = loadData('train/positive')#載入正資料
    negtive = loadData('train/negtive')#載入負資料
    #合併兩個矩陣----相當於拼接到前面一個數組的後面
    x = np.concatenate([positive, negtive])
    y = np.zeros(len(x))
    #賦值標籤
    y[0:len(positive)] = 1.
    y[len(positive):] = 0.

#進度條
    for i in tqdm(range(int(echos))):
        model.fit(x, y, batch_size=batch_size)#訓練傳入資料和標籤
        model.save('model/tongue_%d.model' % i)


if __name__ == '__main__':
    train()

最後整合Cascades模型和卷積網路模型，做影象切割

在識別和切割舌頭頭圖片時，主要用到了Cascades模型和卷積網路模型兩種演算法模型。

其中Cascades模型主完成於舌頭的座標定位；隨後我們會根據這個鞋座標切割出一組影象，而卷積網路模型則用於計算這一組影象中每一個圖片屬於舌頭的概率，最終選取概率最高的一張作為輸出。

opencv舌頭監測模型+keras神經網路（LeNet）

基於前面使用opencv實現舌頭模型檢測後，本次主要針對模型引數調優，提高圖片識別率。之前的模型精準率

卷積神經網路入門一種全卷積神經網路（LeNet），從左至右依次為卷積→子取樣→卷積→子取樣→全連線→全連線→高斯連線測試最後，為了檢驗 CNN 能否工作，我們準備不同的另一組圖片與標記集（不能在訓練

轉載來自：http://blog.csdn.net/maweifei/article/details/52443995 第一層——數學部分 CNN 的第一層通常是卷積層（Convolutional Layer）。輸入內容為一個 32 x 32 x 3 的畫素值陣列。現在

搭建簡單圖片分類的卷積神經網路（三）-- 模型的測試和運用

兩個功能都在同一個檔案中一、新建Disimage.py檔案 import tensorflow as tf from PIL import Image import os import numpy as np import matplotlib.pyplot as plt from Get

搭建簡單圖片分類的卷積神經網路（二）-- CNN模型與訓練

一、首先，簡單來說CNN卷積神經網路與BP神經網路主要區別在於： 1、網路的層數的多少（我這裡的CNN是比較簡單的，層數較少，真正應用的話，層數是很多的）。 2、CNN名稱來說，具有卷積運算的特點，對於大型的圖片或者數量多的圖片，卷積運算可以大量提高計算效能，而BP神經網路大都為全連線層，計

搭建簡單圖片分類的卷積神經網路（一）-- 訓練模型的圖片資料預處理

一、訓練之前資料的預處理主要包括兩個方面 1、將圖片資料統一格式，以標籤來命名並存到train資料夾中（假設原始圖片按類別存到資料夾中）。 2、對命名好的圖片進行訓練集和測試集的劃分以及圖片資料化。先對整個專案檔案進行說明：專案資料夾

序列模型（5）-----雙向神經網路（BRNN）和深層迴圈神經網路（Deep RNN）

一、雙向迴圈神經網路BRNN 採用BRNN原因：雙向RNN，即可以從過去的時間點獲取記憶，又可以從未來的時間點獲取資訊。為什麼要獲取未來的資訊呢？判斷下面句子中Teddy是否是人名，如果只從前面兩個詞是無法得知Teddy是否是人名，如果能有後面的資訊就很好判斷了，這就需要用的雙向迴圈神經網路。

吳恩達序列模型學習筆記--迴圈神經網路（RNN）

1. 序列模型的應用序列模型能解決哪些激動人心的問題呢？語音識別：將輸入的語音訊號直接輸出相應的語音文字資訊。無論是語音訊號還是文字資訊均是序列資料。音樂生成：生成音樂樂譜。只有輸出的音樂樂譜是序列資料，輸入可以是空或者一個整數。情感分類：將輸入的評論句子轉換

用 Keras 編寫你的第一個人工神經網路（Python）—— Jinkey 翻譯

譯者：Jinkey（微信公眾號 jinkey-love）英文原版地址：點選跳轉教程概述這裡不需要編寫太多的程式碼,不過我們將一步步慢慢地告訴你怎麼以後怎麼建立自己的模型。教程將會涵蓋以下步驟: 載入資料定義模型編譯模型訓練模型評估模型結合所有步驟在一起這個教程的前

Deep Learning模型之：CNN卷積神經網路（一）深度解析CNN

http://m.blog.csdn.net/blog/wu010555688/24487301 本文整理了網上幾位大牛的部落格，詳細地講解了CNN的基礎結構與核心思想，歡迎交流。 1. 概述卷積神經網路是一種特殊的深層的神經網路模型，它的特殊性體現在兩個方面，一方面它的神經元

14種模型設計幫你改進你的卷積神經網路（CNN）

摘要：這14 種原創設計模式可以幫助沒有經驗的研究者去嘗試將深度學習與新應用結合，對於那些沒有機器學習博士學位的人來說是一個很好的起點。自2011年以來，深度卷積神經網路（CNN）在影象分類的工作中的表現就明顯優於人類，它們已經成為在計算機視覺領域的一種標準，如影象

深度神經網路（DNN）模型與前向傳播演算法

　　　　深度神經網路（Deep Neural Networks，以下簡稱DNN）是深度學習的基礎，而要理解DNN，首先我們要理解DNN模型，下面我們就對DNN的模型與前向傳播演算法做一個總結。 1. 從感知機到神經網路　　　　在感知機原理小結中，我們介紹過感知機的模型，它是一個有若干輸入和一個輸出的模型，

10分鐘看懂全卷積神經網路（ FCN ）：語義分割深度模型先驅

大家好，我是為人造的智慧操碎了心的智慧禪師。今天是10月24日，既是程式設計師節，也是程式設計師

神經網路（一）：神經元模型與邏輯迴歸

一、仿生學在經典的機器學習領域，有很多不同型別的模型，它們大致可以分為兩類：一類是比較注重模型可解釋性的傳統統計模型，比如線性迴歸和邏輯迴歸；另一類是側重於從結構上“模仿”資料的機器學習模型，比如監督式學習SVM和非監督式學習KMeans。這些模型雖然在結

卷積神經網路（CNN）標準模型分析（四）

卷積神經網路的變種模型（一）卷積神經網路可以改變輸入的形式，比如說把一副影象的R、G、B三個通道看做一個整體輸入，並且採用3D的卷積核，建立3D卷積神經網路模型，以處理視訊影象。（二）卷積神經網路可以採用重疊池化來進行下采樣，比如在AlexNet中就採用

keras與卷積神經網路（CNN）實現識別minist手寫數字

在本篇博文當中，筆者採用了卷積神經網路來對手寫數字進行識別，採用的神經網路的結構是:輸入圖片——卷積層——池化層——卷積層——池化層——卷積層——池化層—

神經網路（三）反向傳播直觀理解

oid 得到文本分類默認 img 自己 src 模型 com 這是典型的三層神經網絡的基本構成，Layer L1是輸入層，Layer L2是隱含層，Layer L3是隱含層，我們現在手裏有一堆數據{x1,x2,x3,...,xn},輸出也是一堆數據{y1,y2,y3,.

卷積神經網路（CNN）在語音識別中的應用

卷積神經網路（CNN）在語音識別中的應用作者：侯藝馨前言總結目前語音識別的發展現狀，dnn、rnn/lstm和cnn算是語音識別中幾個比較主流的方向。2012年，微軟鄧力和俞棟老師將前饋神經網路FFDNN（Feed Forward Deep Neural Network）引入到聲學模

從迴圈神經網路（RNN）到LSTM網路

　　通常，資料的存在形式有語音、文字、影象、視訊等。因為我的研究方向主要是影象識別，所以很少用有“記憶性”的深度網路。懷著對迴圈神經網路的興趣，在看懂了有關它的理論後，我又看了Github上提供的tensorflow實現，覺得收穫很大，故在這裡把我的理解記錄下來，也希望對大家能有所幫助。

卷積神經網路（CNN）_相關知識

斯坦福公開課 CS231n Convolutional Neural Networks for Visual Recognition ： http://cs231n.stanford.edu/syllabus.html 網路引數初始化：https://www.cnblogs.com/yinheyi

卷積神經網路（CNN）一之概念原理

　　什麼是卷積神經網路呢？這個的確是比較難搞懂的概念，特別是一聽到神經網路，大家腦海中第一個就會想到複雜的生物學，讓人不寒而慄，那麼複雜啊．卷積神經網路是做什麼用的呢？它到底是一個什麼東東呢？卷積神經網路的靈感源一種生物程序，其中神經元之間的聯結模式和動物視覺皮層組織非常相似。所以發明者把它叫做卷積神經網

opencv舌頭監測模型+keras神經網路（LeNet）

收集整理資料集

構建卷積神經網路並訓練

最後整合Cascades模型和卷積網路模型，做影象切割

相關推薦