keras交通訊號識別（分類）

阿新 • • 發佈：2018-11-04

自定義卷積網路完成分類。影象預處理（直方圖均衡化增加對比度）。

使用資料：德國交通訊號識別，其中train/test dataset的Images and annotations及test dataset的Extended annotations including class ids。

實驗結果

資料及程式碼組織結構：
在這裡插入圖片描述

訓練過程與結果：

程式碼

"""
@file: tranfficSignRec.py
@time: 2018/10/26
"""
import pandas as pd
import numpy as np
from skimage import 
 io, color, exposure, transform
import glob
import h5py
from keras.models import Sequential, model_from_json
from keras.layers.core import Dense, Dropout, Activation, Flatten
from keras.layers.convolutional import Conv2D
from keras.layers.pooling import MaxPooling2D
from keras.optimizers import SGD
from 
 keras.callbacks import LearningRateScheduler, ModelCheckpoint
from matplotlib import pyplot as plt
import os
from pathlib import PurePath
import warnings

warnings.filterwarnings('ignore')  # 忽略警告

NUM_CLASSES = 43  # 43種交通標誌
IMG_SIZE = 48  # 影象大小歸一化為48

batch_size = 32 # 訓練的引數
nb_epoch = 10
lr = 0.01 



# 影象直方圖均衡化（調整對比度）、取中心、resize
def preprocess_img(img):
    hsv = color.rgb2hsv(img)
    hsv[:, :, 2] = exposure.equalize_hist(hsv[:, :, 2])
    img = color.hsv2rgb(hsv)

    ms = min(img.shape[:2])
    xx = (img.shape[0] - ms) // 2
    yy = (img.shape[1] - ms) // 2
    img = img[xx:xx + ms, yy:yy + ms, :]

    img = transform.resize(img, (IMG_SIZE, IMG_SIZE))

    return img


# 根據路徑（圖片上層目錄）得到標籤
def get_class(img_path):
    return int(PurePath(img_path).parts[- 2])


def readfile():
    # 讀取所有圖片、標籤（onehot），存放至h5py檔案
    try:
        with h5py.File('X.h5') as hf:
            X, Y = hf['imgs'][:], hf['labels'][:]

        print("Loaded images from X.h5")

    except BaseException:
        print("Error in reading X.h5. Processing all images...")
        root_dir = r'../data/GTSRB/Final_Training/Images'
        imgs = []
        labels = []

        all_img_paths = glob.glob(os.path.join(root_dir,'*/*.ppm'))  # 提取所有ppm檔案完整路徑

        np.random.shuffle(all_img_paths)  # 打散
        for img_path in all_img_paths:
            try:
                img = preprocess_img(io.imread(img_path))
                label = get_class(img_path)
                imgs.append(img)
                labels.append(label)

                if len(imgs) % 1000 == 0:
                    print("Processed %d/%d" %(len(imgs), len(all_img_paths)))
            except BaseException:
                print('missed', img_path)
                pass
        X = np.array(imgs, dtype='float32')
        # labels陣列轉onehot
        Y = np.eye(len(labels), NUM_CLASSES, dtype=np.uint8)[labels]

        # 可以加速載入與處理
        with h5py.File('X.h5', 'w') as hf:
            hf.create_dataset('imgs', data=X)
            hf.create_dataset('labels', data=Y)
    return X, Y


def cnn_model():

    model = Sequential()

    model.add(Conv2D(32,(3,3),padding='same',activation='relu',input_shape=(IMG_SIZE,IMG_SIZE,3)))
    model.add(Conv2D(32, (3, 3), activation='relu'))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Dropout(0.2))

    model.add(Conv2D(64, (3, 3), padding='same', activation='relu'))
    model.add(Conv2D(64, (3, 3), padding='same', activation='relu'))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Dropout(0.2))

    model.add(Conv2D(128, (3, 3), padding='same', activation='relu'))
    model.add(Conv2D(128, (3, 3), padding='same', activation='relu'))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Dropout(0.2))

    model.add(Flatten())
    model.add(Dense(512, activation='relu'))
    model.add(Dropout(0.5))
    model.add(Dense(NUM_CLASSES, activation='softmax'))

    sgd = SGD(lr=lr, decay=1e-6, momentum=0.9, nesterov=True)
    model.compile(
        loss='categorical_crossentropy',
        optimizer=sgd,
        metrics=['accuracy'])

    return model

# 每10個epoch學習率遞減0.1倍
def lr_schedule(epoch):

    return lr * (0.1 ** int(epoch / 10))


def train():
    model = cnn_model()
    print(model.summary())
    X, Y = readfile()
    history = model.fit(X,Y,
        batch_size=batch_size,
        epochs=nb_epoch,
        validation_split=0.2,
        shuffle=True,
        verbose=2,
        callbacks=[
            LearningRateScheduler(lr_schedule),
            # ModelCheckpoint('model.h5',save_best_only=True)
        ])
    # 視覺化訓練曲線（train,val）
    plt.figure(figsize=(8, 4))
    plt.subplot(1, 2, 1)
    plot_train_history(history, 'loss', 'val_loss')
    plt.subplot(1, 2, 2)
    plot_train_history(history, 'acc', 'val_acc')
    plt.show()
    return model

def plot_train_history(history, train_metrics, val_metrics):
    plt.plot(history.history.get(train_metrics), '-o')
    plt.plot(history.history.get(val_metrics), '-o')
    plt.ylabel(train_metrics)
    plt.xlabel('Epochs')
    plt.legend(['train', 'validation'])


# 在測試集上測試
def test(model):
    test = pd.read_csv('../data/GTSRB/GT-final_test.csv',sep=';')
    X_test = []
    y_test = []
    for file_name, class_id in zip(list(test['Filename']), list(test['ClassId'])):
        img_path = os.path.join('../data/GTSRB/Final_Test/Images/', file_name)
        X_test.append(preprocess_img(io.imread(img_path)))
        y_test.append(class_id)
    X_test = np.array(X_test)
    y_test = np.array(y_test)

    print("X_test.shape: ", X_test.shape)
    print("y_test.shape: ", y_test.shape)

    y_pred = model.predict_classes(X_test) # 返回預測值
    acc = np.sum(y_pred == y_test) / np.size(y_pred)
    print("Test accuracy = {} ".format(acc))


if __name__ == '__main__':
    model=train()
    test(model)

參考：https://github.com/erhwenkuo/deep-learning-with-keras-notebooks

keras交通訊號識別（分類）

自定義卷積網路完成分類。影象預處理（直方圖均衡化增加對比度）。使用資料：德國交通訊號識別，其中train/test dataset的Images and annotations及test dataset的Extended annotations including class id

莫煩大大keras學習Mnist識別（3）-----CNN

一、步驟：匯入模組以及讀取資料資料預處理構建模型編譯模型訓練模型測試二、程式碼：匯入模組以及讀取資料 #導包 import numpy as np np.random.seed(1337) # from k

莫煩大大keras學習Mnist識別（4）-----RNN

一、步驟：匯入包以及讀取資料設定引數資料預處理構建模型編譯模型訓練以及測試模型二、程式碼： 1、匯入包以及讀取資料 #匯入包 import numpy as np np.random.seed(1337) #設定之後每次執

基於SVM和KNN的手寫數字的識別（分類）——小試牛刀篇

下面分別採用的是k近鄰演算法（KNN）和SVM實現的手寫數字識別。 python實現程式碼： # -*- coding: utf-8 -*- import os import numpy as np def img2vector(filename, label): #

python實現人臉檢測及識別（2）---- 利用keras庫訓練人臉識別模型

前面已經採集好資料集boss資料夾存放需要識別的物件照片，other存放其他人的訓練集照片，現在，我們終於可以嘗試訓練我們自己的卷積神經網路模型了。CNN擅長影象處理，keras庫的tensorflow版亦支援此種網路模型，萬事俱備，就放開手做吧。前面說過，我們需要通過大量的訓練資料訓練我們的模型，

模式識別（三）非線性分類器

遇到像圖1中所示的樣本分類，線性方法是無法發揮作用的。因為塔是線性不可分的，這時候必須採用非線性方法。 1. 多層感知器網路多層感知器包含一個以上隱層和一個輸出層，隱層將輸入對映到一個超立方體頂點，輸出層完成線性分類。通過隱層不斷對映，最終可以將樣本

人臉識別（二）——訓練分類器

上一篇簡單整理了下人臉識別的相關基礎知識，這一篇將著重介紹利用pencv（2.4.9）已有的模型進行分類器訓練。一、關於ORL人臉資料庫 ORL是一個40個人，每人採取10張人臉頭像構成的一

表情識別（二）--基於CNN分類

說白了，就是個分類任務，但是純粹的CNN分類，只是對傳統方式的提升，本質思路沒有改變，效果也不是很明顯。轉自：https://blog.csdn.net/walilk/article/details/58709611 前言　　[機器學習] 實驗筆記系列是以我在演算法

神經網絡結構在命名實體識別（NER）中的應用

field edi most 好的向量後來目標領域 png 神經網絡結構在命名實體識別（NER）中的應用近年來，基於神經網絡的深度學習方法在自然語言處理領域已經取得了不少進展。作為NLP領域的基礎任務—命名實體識別（Named Entity Recogni

C++雜記：運行時類型識別（RTTI）與動態類型轉換原理

程序包 bar ons Language 值類型包括 iat www != 運行時類型識別（RTTI）的引入有三個作用：配合typeid操作符的實現；實現異常處理中catch的匹配過程；實現動態類型轉換dynamic_cast。 1. typeid操

語音識別（SR）的秘密

天上掉餡餅 mar 天上的人 spa 谷歌 pos bottom 微軟語音識別（SR）功能是當今國外操作系統的標準特征，而國產操作系統根本不具備這樣的特質，並且國家隊沒有相關的主觀動力。去開發實際可用的語音識別系統。與國外相比，國

我的畢設-基於OpenCV的圖像車牌識別（I）

應該 details 計算 inpu eight 切換 named path變量 pen 由於大三以來一直在學路由交換和Linux方面，所以Coding能力大幅下降，加上畢設老師指定了一個完全不會的題目，恍如晴天霹靂，硬著頭皮接下了任務，查閱了相關資料以後暫定使用OpenC

京東金融大數據競賽豬臉識別（1）-從視頻提取圖像

京東金融豬臉識別視頻提取圖像幀 2017年11月的京東金融大數據競賽參與人數最多的是豬臉識別的算法比賽，參加整個大數據比賽的有四千多人，而豬臉識別算法組就有一千多人。可見，搞圖像識別的的人很多啊。想要提升自己價值的小夥伴們，向語音、文本、機器人等領域進發吧，有了機器學習的基礎，入門這些領

京東金融大數據競賽豬臉識別（3）-方法選取

特征提取圖像識別分類方法由於可用的特征提取和分類器構造方法較多，為了確定選取方法。現在在視頻提取的圖像上進行算法驗證，取這些圖像的一部分進行訓練，剩余部分進行測試，並進行交叉驗證。找到準確率最高的方法後再將其用於測試集。以reco_toolbox為例，下面給出方法選取的代碼： clc,clo

京東金融大數據競賽豬臉識別（2）- 圖像特征提取之一

圖像特征提取文件夾遍歷圖像識別進入深度學習時代後，特征提取這個詞的使用頻率明顯下降了。因為深度網絡已經完成了從圖像輸入到分類結果輸出的全過程，似乎不需要再關心特征的好壞和特征提取對於識別結果的影響。不過，不管從算法研究還是工程實現角度看，將特征提取獨立出來應該更有利。這樣我們可以對各種特征提取方法

京東金融大數據競賽豬臉識別（6）- 識別方法之三

圖像分類 softmax Matlab Matlab提供了最簡單的多分類功能，兩個函數（trainSoftmaxLayer和net）就能完成。即先對對訓練圖像集構造softmax層，然後對測試圖像進行分類。這兩個函數可以在訓練圖像和測試圖像上完成分類的主要功能。代碼如下： clear; %加載訓練

京東金融大數據競賽豬臉識別（5）- 識別方法之二

圖像檢索詞袋 bag-of-feature Matlab 該方法提取圖像集的詞袋（bag-of-features），然後根據詞袋對各圖像編碼得出圖像特征，再對測試圖像在訓練圖像集上進行檢索，最後根據檢索出的圖像類別判斷測試圖像所屬類別。該方法直接對圖像進行處理，不需要先提取特征，再將特征文件

京東金融大數據競賽豬臉識別（3）- 圖像特征提取之二

Alexnet 圖像特征 fc7 深度網絡既然在圖像識別方面有很高的準確率，那將某一層網絡輸出數據作為圖像特征也應該是可行的。該程序給出了使用Alexnet第七層作為激活層提取圖像特征的示例。代碼如下： clear; trainPath = fullfile(pwd,‘image‘); train

京東金融大數據競賽豬臉識別（9）- 識別方法之五

圖像識別深度網絡預訓練模型這裏給出使用深度網絡中間層輸出結果作為圖像特征，並構建分類模型和對訓練數據進行識別的代碼。相關內容可參看Matlab圖像識別/檢索系列(7)-10行代碼完成深度學習網絡之取中間層數據作為特征。代碼如下： clear trainPath = fullfile(pwd,

ROS kinetic語音識別（轉）

line 目錄路徑 inf AC ESS data html amd 1.安裝依賴 1.1安裝ros-kinetic-audio-common 1 sudo apt-get install ros-kinetic-audio-common

keras交通訊號識別（分類）

實驗結果

程式碼

相關推薦