keras系列（二）：模型設定

阿新 • • 發佈：2018-12-12

Keras模型簡介

Keras的初始構建塊是一個模型，最簡單的模型稱為序列。Keras序列模型是一個神經網路層的線性管道(一個堆疊)。

from keras.models import Sequential
model = Sequential()
model.add(Dense(12, input_dim=8, kernel_initializer='random_uniform'，bias_initializer='zeros')))

上述程式碼定義了一個12個人工神經元單層網路，需要8個輸入變數（特徵值），每個神經元用具體的權重初始化。

構成模組的第二種方式是通過functional API，在那裡可以定義複雜的模型，例如有向無環圖、具有共享層的模型或多輸出模型。

常規的全連線層

keras.layers.core.Dense(units, activation=None, use_bias=True, kernel_initializer='glorot_uniform'）

預先定義的RNN

keras.layers.recurrent.Recurrent(return_sequences=False, go_backwards=False, stateful=
keras.layers.recurrent.SimpleRNN(units, activation='tanh', use_bias=True, kernel_initializer=
keras.layers.recurrent.GRU(units, activation='tanh', recurrent_activation='hard_sigmoid'
keras.layers.recurrent.LSTM(units, activation='tanh', recurrent_activation='hard_sigmoid'

卷積和池化層

ConvNets是一種使用卷積和池化操作的神經網路，它基於抽象的漸進層次逐步學習相當複雜的模型。這種漸進抽象的學習類似於在人類大腦中進化了數百萬年的視覺模型。幾年前，人們把它叫做深度3-5層，現在已經上升到100-200。

keras.layers.convolutional.Conv1D(filters, kernel_size, strides=1, padding='valid', dilation_rate=
keras.layers.convolutional.Conv2D(filters, kernel_size, strides=(1, 1), padding='valid'
keras.layers.pooling.MaxPooling1D(pool_size=2, strides=None, padding='valid')
keras.layers.pooling.MaxPooling2D(pool_size=(2, 2), strides=None, padding='valid', data_format=

Keras的基本操作

根據以上的方法，設定模型引數：

import numpy as np
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers.core import Dense, Activation
from keras.optimizers import SGD
from keras.utils import np_utils
np.random.seed(1671) # for reproducibility
# network and training
NB_EPOCH = 200
BATCH_SIZE = 128
VERBOSE = 1
NB_CLASSES = 10 # number of outputs = number of digits
OPTIMIZER = SGD() # SGD optimizer, explained later in this chapter
N_HIDDEN = 128
VALIDATION_SPLIT=0.2 # how much TRAIN is reserved for VALIDATION
# data: shuffled and split between train and test sets
# (
X_train, y_train), (X_test, y_test) =
mnist.load_data()
#X_train is 60000 rows of 28x28 values --> reshaped in 60000 x 784
RESHAPED = 784
# X_train =
X_train.reshape(60000, RESHAPED)
X_test = X_test.reshape(10000, RESHAPED)
X_train = X_train.astype('float32')
X_test = X_test.astype('float32')
# normalize
X_train /= 255
X_test /= 255
print(X_train.shape[0], 'train samples')
print(X_test.shape[0], 'test samples')
# convert class vectors to binary class matrices
Y_train = np_utils.to_categorical(y_train, NB_CLASSES)
Y_test = np_utils.to_categorical(y_test, NB_CLASSES)

通常，設定完以上引數時，模型可以設定編譯了，如下：

# 10 outputs
# final stage is softmax
model = Sequential()
model.add(Dense(NB_CLASSES, input_shape=(RESHAPED,)))
model.add(Activation('softmax'))
model.summary() # output the model constuct including the total params
model.compile(loss='categorical_crossentropy', optimizer=OPTIMIZER, metrics=['accuracy'])

一旦模型被編譯完成，接著就可以用 fit 函式訓練了，其中需要設定引數如下：

epochs

這是模型用於訓練的次數。在每次迭代中，優化器嘗試調整權重，使目標函式最小化。

batch_size

這是在優化器執行權重更新之前用到的訓練例項的數量。

設定完以上引數，則可以對模型進行 fit 操作了：

history = model.fit(X_train, Y_train,
batch_size=BATCH_SIZE, epochs=NB_EPOCH,
verbose=VERBOSE, validation_split=VALIDATION_SPLIT)

一旦訓練了模型，我們就可以在測試集上進行評估。通過這種方法，我們可以得到目標函式所達到的最小值，以及評價指標達到的最佳值。

score = model.evaluate(X_test, Y_test, verbose=VERBOSE)
print("Test score:", score[0]) #loss
print('Test accuracy:', score[1]) #accuracy

基於以上層，再加入隱藏層和Drop out，程式碼如下：

import numpy as np
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers.core import Dense, Activation
from keras.optimizers import SGD
from keras.utils import np_utils
np.random.seed(1671) # for reproducibility
# network and training
NB_EPOCH = 20
BATCH_SIZE = 128
VERBOSE = 1
NB_CLASSES = 10 # number of outputs = number of digits
OPTIMIZER = SGD() # optimizer, explained later in this chapter
N_HIDDEN = 128
VALIDATION_SPLIT=0.2 # how much TRAIN is reserved for VALIDATION
# data: shuffled and split between train and test sets
(X_train, y_train), (X_test, y_test) = mnist.load_data()
#X_train is 60000 rows of 28x28 values --> reshaped in 60000 x 784
RESHAPED = 784
# X_train =
X_train.reshape(60000, RESHAPED)
X_test = X_test.reshape(10000, RESHAPED)
X_train = X_train.astype('float32')
X_test = X_test.astype('float32')
# normalize
X_train /= 255
X_test /= 255
print(X_train.shape[0], 'train samples')
print(X_test.shape[0], 'test samples')
# convert class vectors to binary class matrices

Y_train = np_utils.to_categorical(y_train, NB_CLASSES)
Y_test = np_utils.to_categorical(y_test, NB_CLASSES)
# M_HIDDEN hidden layers
# 10 outputs
# final stage is softmax

model = Sequential()
model.add(Dense(N_HIDDEN, input_shape=(RESHAPED,)))
model.add(Activation('relu'))
model.add(Dropout(DROPOUT))
model.add(Dense(N_HIDDEN))
model.add(Activation('relu'))
model.add(Dropout(DROPOUT))
model.add(Dense(NB_CLASSES))
model.add(Activation('softmax'))

model.summary()
model.compile(loss='categorical_crossentropy',
optimizer=OPTIMIZER,
metrics=['accuracy'])
history = model.fit(X_train, Y_train,
batch_size=BATCH_SIZE, epochs=NB_EPOCH,
verbose=VERBOSE, validation_split=VALIDATION_SPLIT)
score = model.evaluate(X_test, Y_test, verbose=VERBOSE)
print("Test score:", score[0])
print('Test accuracy:', score[1])

預測輸出

當一個網路被訓練時，它可以被用來預測。在Keras這很簡單，我們可以使用以下方法：

# calculate predictions
predictions = model.predict(X)

對於給定的輸入，可以計算幾種型別的輸出，包括方法：

model.evaluate(): This is used to compute the loss values
model.predict_classes(): This is used to compute category outputs
model.predict_proba(): This is used to compute class probabilities

keras系列（二）：模型設定

Keras模型簡介 Keras的初始構建塊是一個模型，最簡單的模型稱為序列。Keras序列模型是一個神經網路層的線性管道(一個堆疊)。 from keras.models import Sequential model = Sequential() model.

keras系列（一）：引數設定

常用的權重/偏置初始化常數初始化為了在虛擬碼中形象化，讓我們考慮一個具有64個輸入和32個輸出的神經網路的任意一層。 W = np.zeros((64, 32)) W = np.ones((64, 32)) W = np.ones((64, 32))

Unity3D之Mecanim動畫系統學習筆記（二）：模型導入

leg character ... sdk ocs 物體 mat 版本 sset 我們要在Unity3D中使用上模型和動畫，需要經過下面幾個階段的制作，下面以一個人形的模型開發為準來介紹。模型制作模型建模（Modelling）我們的美術在建模時一般會制作一個稱為

容器開啟數據服務之旅系列（二）：Kubernetes如何助力Spark大數據分析

容器控制臺摘要：容器開啟數據服務之旅系列（二）：Kubernetes如何助力Spark大數據分析（二）：Kubernetes如何助力Spark大數據分析概述本文為大家介紹一種容器化的數據服務Spark + OSS on ACK，允許Spark分布式計算節點對阿裏雲OSS對象存儲的直接訪問。

JavaScript夯實基礎系列（二）：閉包

情況全局環境賦值命名因此沒有部分 .com 查詢 ??在JavaScript中函數是一等公民。所謂一等公民是指函數跟其他對象一樣，很普通，可以進行把函數存在數組中、作為參數傳遞、賦值給變量等操作。當函數作為另一個函數的返回值在外部調用時，跟該函數在函數內部調用時

ELK系列（二）：.net core中使用ELK

正常 etc () 完成後 class -c tro 訪問 ret ELK安裝好後，我們現在.net Core中使用一下，大體思路就是結合NLog日誌組件將數據寫入ELK中，其它語言同理。 ELK的安裝還是有些復雜的，我們也可以在Docker中安裝ELK：docker ru

eShopOnContainers學習系列（二）：數據庫連接健康檢查

技術分享負載 star bsp 方法 containe 需要正常連接項目裏使用數據庫的時候，我們有時候需要知道數據庫當前的健康狀態，特別是當數據庫連接不上的時候能夠立馬獲悉。eShopOnContainers裏存在著大量的服務健康、連接健康的檢查，數據庫連接是其中之

linux系列（二）：cd命令

1、命令格式：　　cd [目錄名] 2、命令功能：　　切換當前目錄至目錄名目錄 3、常用例項（1）、進入系統根目錄命令：　　cd / 輸出： [email protected]:~/軟體$ cd / [email protected]-computer:/

Windows Service 學習系列（二）：C# windows服務：安裝、解除安裝、啟動和停止Windows Service

一、通過CMD安裝、解除安裝、啟動、停止Windows Service　　　　方法一　　1.以管理員身份執行cmd 　　2.安裝windows服務　　　　切換cd C:\Windows\Microsoft.NET\Framework\v4.0.30319(InstallUtil.e

faster rcnn pytorch 復現系列（二）：generate_anchors原始碼解析

目錄 1. 總函式 generate_anchors 2. 函式分功能寫，首先是ratios的實現，其次是scale的實現 3. anchor2WHXY函式+WsHsXsYs2anchors函式[s表示複數] 4. _ratio_enum(anchor,r

Fragment全解析系列（二）：正確的使用姿勢

Fragment是可以讓你的app縱享絲滑的設計，如果你的app想在現在基礎上效能大幅度提高，並且佔用記憶體降低，同樣的介面Activity佔用記憶體比Fragment要多，響應速度Fragment比Activty在中低端手機上快了很多，甚至能達到好幾倍！如果你的app當前或以後有移植平板等平臺時，

詳解SVM系列（二）：拉格朗日對偶性

拉格朗日函式有什麼用？在約束最優化問題中，常常利用拉格朗日對偶性將原始問題轉換為對偶問題，通過解對偶問題而得到原始問題的解。原始問題：假設 f (

Docker系列（二）：通過Docker安裝使用 Kubernetes （K8s）

Docker社群版從17.12版本開始已經提供了對Kubernetes的支援。但是由於其安裝過程依賴的映象服務在國內訪問很不穩定，很多朋友都無法配置成功。我們提供了一個簡單的工具幫助大家開啟Docker社群版的Kubernetes功能。我們需要先安裝好Docker CE的最新版，18.03 - 18.09

redis系列（二）：資料操作

1、string型別字串型別是Redis中最為基礎的資料儲存型別，它在Redis中是二進位制安全的，這便意味著該型別可以接受任何格式的資料，如JPEG影象資料或Json物件描述資訊等。在Redis中字串型別的Value最多可以容納的資料長度是512M。（1）、儲存如果設定的鍵不存在則新增，如果已存

STM32開發筆記48：STM32F4+DP83848乙太網通訊指南系列（二）：系統時鐘

本章為系列指南第二章，主要是介紹一下STM32F4的時鐘配置。時鐘是一個嵌入式產品從零開始開發的基石，一切邏輯都在時鐘的節奏中安靜地彈奏著，時鐘為整個電路帶來了歡快的「心跳」。開發者如果對時鐘沒有控制能力，就會把脈不準整個旋律的節奏，從而導致諸如通訊波特率、通訊時序、延時操作等關鍵功能全都紊亂，系統

Web安全系列（二）：XSS 攻擊進階（初探 XSS Payload）

什麼是 XSS Payload 上一章我談到了 XSS 攻擊的幾種分類以及形成的攻擊的原理，並舉了一些淺顯的例子，接下來，我就闡述什麼叫做 XSS Payload 以及從攻擊者的角度來初探 XSS 攻擊的威力。在黑客 XSS 攻擊成功之後，攻擊者能夠對使用者當前瀏覽的頁面植入各種惡意指令碼，通過惡意指令碼來

image caption解讀系列（二）：《Knowing When to Look: Adaptive Attention via A Visual Sentinel for Image Capt》

本文主要是在這篇部落格的基礎上結合程式碼進行分析。文章依然採用了encoder-decoder的框架。作者認為decoder的時候非視覺詞多依賴的是語義資訊而不是視覺資訊。而且，在生成caption的過程中，非視覺詞的梯度會誤導或者降低視覺資訊的有效性。因此，本文提出

爬蟲入門系列（二）：優雅的HTTP庫requests

爬蟲入門系列目錄： urllib、urllib2、urllib3、httplib、httplib2 都是和 HTTP 相關的 Python 模組，看名字就覺得很反人類，更糟糕的是這些模組在 Python2 與 Python3 中有很大的差異，如果業務程式碼要同時相容 2 和 3，寫起來

image caption解讀系列（二）：《Show, Attend and Tell_Neural Image Caption》

一、相關工作二、基本思想文章在NIC的基礎上加入了attention機制三、模型結構對LSTM部分做出的改動，其餘與NIC相同。四、程式碼分析 (0)預處理首先是把資料中長度大於2

文字編輯器啟用系列（二）：UltraEdit安裝、啟用、漢化教程

前言推薦幾款文字編輯器： Sublime：內嵌python直譯器、大量外掛 EditPlus：語法著色、內嵌瀏覽器 Notepad++：所見即所得功能 UltraEdit：程式設計師的最愛印象筆記：免啟用雲同步為什麼說UltraE

keras系列（二）：模型設定

Keras模型簡介

Keras的基本操作

預測輸出

相關推薦