利用Module模組把構建的神經網路跑起來

阿新 • • 發佈：2018-12-29

訓練一個神經網路往往只需要簡單的幾步：

準備訓練資料
初始化模型的引數
模型嚮往計算與向後計算
更新模型引數
設定相關的checkpoint

如果上述的每個步驟都需要我們寫Python的程式碼去一步步實現，未免顯的繁瑣，好在MXNet提供了Module模組來解決這個問題，Module把訓練和推理中一些常用到的步驟程式碼進行了封裝。對於一定已經用Symbol定義好的神經網路，我們可以很容易的使用Module提供的一些高層次介面或一些中間層次的介面來讓整個訓練或推理容易操作起來。

下面我們將通過在UCI letter recognition資料集上訓練一個多層感知機來說明Module模組的用法。

第一步載入一個數據集

我們先下載一個數據集，然後按80：20的比例劃分訓練集與測試集。我們通過MXNet的IO模組提供的資料迭代器每次返回一個batch size =32的訓練樣本

import logging
logging.getLogger().setLevel(logging.INFO)
import mxnet as mx
import numpy as np

# 資料以文字形式儲存，每行一個樣本，每一行資料之間用','分割，每一個字元為label
fname = mx.test_utils.download('http://archive.ics.uci.edu/ml/machine-learning-databases/letter-recognition/letter-recognition.data')
data = np.genfromtxt(fname, delimiter=',')[:,1:]
label = np.array([ord(l.split(',')[0])-ord('A') for l in open(fname, 'r')])

batch_size = 32
ntrain = int(data.shape[0]*0.8)
train_iter = mx.io.NDArrayIter(data[:ntrain, :], label[:ntrain], batch_size, shuffle=True)
val_iter = mx.io.NDArrayIter(data[ntrain:, :], label[ntrain:], batch_size)

第二步定義一個network

net = mx.sym.var('data')
net = mx.sym.FullyConnected(data=net, name='fc1', num_hidden=64)
net = mx.sym.Activation(data=net, name='relu1', act_type='relu')
net = mx.sym.FullyConnected(data=net, name='fc2', num_hidden=26)
net = mx.sym.SoftmaxOutput(net, name='softmax')
mx.viz.plot_network(net)

第三步建立一個Module

我們可以通過mx.mod.Module介面建立一個Module物件，它接收下面幾個引數：

symbol:神經網路的定義
context：執行運算的裝置
data_names：網路輸入資料的列表
label_names：網路輸入標籤的列表

對於我們在第二步定義的net，只有一個輸入資料即data，輸入標籤名為softmax_label，這個是我們在使用SoftmaxOutput操作時，自動命名的。

mod = mx.mod.Module(symbol=net, 
                    context=mx.cpu(), 
                    data_names=['data'], 
                    label_names=['softmax_label'])

Module的中間層次的介面

中間層次的介面主要是為了給開發者足夠的靈活性，也方便排查問題。我們下面會先列出來Moduel模組有哪些常見的中間層API，然後再利用這個API來訓練我們剛才定義的網路。

bind：繫結輸入資料的形狀，分配記憶體
init_params：初始化網路引數
init_optimizer：指定優化方法，比如sgd
metric.create：指定評價方法
forward：向前計算
update_metric：根據上一次的forward結果，更新評價指標
backward：反射傳播
update：根據優化方法和梯度更新模型的引數

# allocate memory given the input data and label shapes
mod.bind(data_shapes=train_iter.provide_data, label_shapes=train_iter.provide_label)
# initialize parameters by uniform random numbers
mod.init_params(initializer=mx.init.Uniform(scale=.1))
# use SGD with learning rate 0.1 to train
mod.init_optimizer(optimizer='sgd', optimizer_params=(('learning_rate', 0.1), ))
# use accuracy as the metric
metric = mx.metric.create('acc')
# train 5 epochs, i.e. going over the data iter one pass
for epoch in range(5):
    train_iter.reset()
    metric.reset()
    for batch in train_iter:
        mod.forward(batch, is_train=True)       # compute predictions
        mod.update_metric(metric, batch.label)  # accumulate prediction accuracy
        mod.backward()                          # compute gradients
        mod.update()                            # update parameters
    print('Epoch %d, Training %s' % (epoch, metric.get()))

Module 高層次的API

訓練

Moudle模組同時提供了高層次的API來完成訓練、預測和評估。不像使用中間層次API那樣繁瑣，我們只需要一個介面fit就可以完成上面的步驟。

# reset train_iter to the beginning
train_iter.reset()

# create a module
mod = mx.mod.Module(symbol=net,
                    context=mx.cpu(),
                    data_names=['data'],
                    label_names=['softmax_label'])

# fit the module
mod.fit(train_iter,
        eval_data=val_iter,
        optimizer='sgd',
        optimizer_params={'learning_rate':0.1},
        eval_metric='acc',
        num_epoch=8)

預測和評估

使用Moudle.predict可以得到資料的predict的結果。如果我們對結果不關心，我們可以使用score介面直接計算驗證資料集的準確率。

y = mod.predict(val_iter)
score = mod.score(val_iter, ['acc'])
print("Accuracy score is %f" % (score[0][1]))

上面的程式碼中我們使用了acc來計算準確率，我們還可以設定其他評估方法，如：top_k_acc,F1,RMSE,MSE,MAE,ce等。

訓練模型的儲存

我們可以通過設計一個checkpoint calback來在訓練過程中每個epoch結束後儲存模型的引數

# construct a callback function to save checkpoints
model_prefix = 'mx_mlp'
checkpoint = mx.callback.do_checkpoint(model_prefix)

mod = mx.mod.Module(symbol=net)
mod.fit(train_iter, num_epoch=5, epoch_end_callback=checkpoint)

使用load_checkpoint來載入已經儲存的模型引數，隨後我們可以把這些引數載入到Moudle中

sym, arg_params, aux_params = mx.model.load_checkpoint(model_prefix, 3)
# assign the loaded parameters to the module
mod.set_params(arg_params, aux_params)

我們也可以不使用set_params，而是直接在fit介面中指定已經儲存的checkpoint的引數，這些儲存的引數會替代fit原本的引數初始化。

mod = mx.mod.Module(symbol=sym)
mod.fit(train_iter,
        num_epoch=21,
        arg_params=arg_params,
        aux_params=aux_params,
        begin_epoch=3)

利用Module模組把構建的神經網路跑起來

訓練一個神經網路往往只需要簡單的幾步：準備訓練資料初始化模型的引數模型嚮往計算與向後計算更新模型引數設定相關的checkpoint 如果上述的每個步驟都需要我們寫Python的程式碼去一步步實現，未免顯的繁瑣，好在MXNet提供了Module模組來解決這個問題，Module把訓練和推理中一些常用

使用Sybmol模組來構建神經網路

符號程式設計在之前的文章，我們介紹了NDArray模組，它是MXNet中處理資料的核心模組，我們可以使用NDArray完成非常豐富的數學運算。實際上，我們完全可以使用NDArray來定義神經網路，這種方式我們稱它為命令式的程式設計風格，它的優點是編寫簡單直接，方便除錯。像下面我們就定義了一個兩層的神經網路，

TensorFlow神經網路：模組化的神經網路八股

1、前向傳播：搭建從輸入到輸出的網路結構 forward.py: # 定義前向傳播過程 def forward(x, regularizer): w = b = y = return y # 給w賦初值，並把w的正則化損失加到總損失中 def g

TensorSpace：一套用於構建神經網路3D視覺化應用的框架

作者 | syt123450、Chenhua Zhu、Yaoxing Liu （本文經原作者授權轉載）今天要為大家推薦一套超酷炫的，用於構建神經網路 3D 視覺化應用的框架——TensorSpace。有什麼用途？大家可以使用類 Keras

利用Python實現卷積神經網路的視覺化（附Python程式碼）

對於深度學習這種端到端模型來說，如何說明和理解其中的訓練過程是大多數研究者關注熱點之一，這個問題對於那種高風險行業顯得尤為重視，比如醫療、軍事等。在深度學習中，這個問題被稱作“黑匣子（Black Box）”。如果不能解釋模型的工作過程，我們怎麼能夠就輕易相信模型的輸出結果呢？以深度學習模型檢測

lesson22-24 MNIST資料集，模組化搭建神經網路八股，手寫數字識別準確率輸出

import tensorflow as tf #MNIST資料集輸出識別準確率 #MNIST資料集： #提供6w張28*28畫素點的0-9手寫數字圖片和標籤，用於訓練 #提供1w張28*28畫素點的0-9手寫數字圖片和標籤，用於測試 #每張圖片的784個畫素點（

使用NetworkX模組繪製深度神經網路（DNN）結構圖

本文將展示如何利用Python中的NetworkX模組來繪製深度神經網路（DNN）結構圖。在文章Keras入門（一）搭建深度神經網路（DNN）解決多分類問題中，我們建立的DNN結構圖如下：該DNN模型由輸入層、隱藏層、輸出層和softmax層組成，

matlab利用訓練好的BP神經網路來預測新資料（先儲存網路，再使用網路）

1，儲存網路。　　save ('net') % net為已訓練好的網路，這裡把他從workspace儲存到工作目錄，顯示為net.mat文件。 2，使用網路。　　load ('net')

【論文閱讀】利用深度自編碼器神經網路預測藥物相似度

論文來源： Prediction of Drug-Likeness Using Deep Autoencoder Neural Networks 摘要由於各種各樣的原因，大多數候選藥物最終不能成為上市藥物。建立可靠的預測候選化合物是否具有藥物相似度對提高藥物的發現

使用pytorch構建神經網路的流程以及一些問題

使用PyTorch構建神經網路十分的簡單，下面是我總結的PyTorch構建神經網路的一般過程以及我在學習當中遇到的一些問題，期望對你有所幫助。 PyTorch構建神經網路的一般過程下面的程式是PyTorch官網60分鐘教程上面構建神經網路的例子，版本0.4.1： import torch import

Make Your Own Neural Network（八）-----利用矩陣計算三層神經網路的輸出結果

Make Your Own Neural Network構建你自己的神經網路作者：lz0499宣告：1）Make Your Own Neural Network翻譯自編寫的神經網路入門書籍。作者的目的是儘可能的少用術語和高深的數學知識，以圖文並茂的方式講解神經網路是如何工作的

利用TensorFlow使卷積神經網路各層及卷積特徵視覺化

# -*- coding: utf-8 -*-"""Created on Thu Apr 26 14:37:30 2018@author: Administrator"""#匯入所需要的庫import numpy as npimport tensorflow as tfimport matplotlib.py

基於PyTorch的深度學習入門教程（四）——構建神經網路

前言本文參考PyTorch官網的教程，分為五個基本模組來介紹PyTorch。為了避免文章過長，這五個模組分別在五篇博文中介紹。本文是關於Part3的內容。Part3：使用PyTorch構建一個神經網路神

Tensorflow BatchNormalization詳解：2_使用tf.layers高階函式來構建神經網路

Batch Normalization: 使用tf.layers高階函式來構建神經網路覺得有用的話,歡迎一起討論相互學習~Follow Me # Batch Normalization – Solutions # Batch Normaliza

利用TensorFlow實現卷積神經網路做文字分類

這篇部落格是翻譯Denny Britz寫的使用卷積神經網路做文字分類並且在Tensorflow上面實現，作者已經授權翻譯，這是原文。在這篇部落格中，我們將實現一個類似於 Kim Yoon 論文中用於句子分類的卷積神經網路模型。論文中的模型在一系列文字分類任務（如情感分類）中獲得了良好的分類效能，併成為新文字

初次使用NeuralExpert構建神經網路

NeuroSolutions提供了四種方式構建神經網路，分別是NeuralExpert、NeuralBuilder、pre-recorded macro和手動建立。執行NeuralExpert是構建神經網路最簡單的方法。本文主要介紹如何利用NeuralExpert構建神經

tensorflow1.1/構建神經網路分類

環境：tensorflow1.1，matplotlib2.02，python3 #coding:utf-8 """ tensorflow 1.1 python 3 matplotlib 2.02 ""

讓初學者把Rxjava+Retrofit先跑起來

這是一篇淺顯的Rxjava+Retrofit文章，從初學者出發，感覺如果工作中沒有充足發揮自學技能的專案，直接去看大佬們寫的很深入的講解，特別容易遺忘、懵甚至不理解，所以我決定寫一篇淺顯的使用Rxjava+Retrofit的文章。所需依賴庫：compile"io.reacti

pytorch入門（2）-------神經網路的構建

https://blog.csdn.net/broken_promise/article/details/81174760 一、神經網路的構建：激勵函式的選擇，如果層數較少的神經網路，激勵函式有多種選擇，在影象卷積神經網路中，激勵函式選擇ReLu，在迴圈神經網路中，選擇ReL或者Tanh。所有的層結

【火爐煉AI】深度學習002-構建並訓練單層神經網路模型

【火爐煉AI】深度學習002-構建並訓練單層神經網路模型 (本文所使用的Python庫和版本號: Python 3.6, Numpy 1.14, scikit-learn 0.19, matplotlib 2.2 ) 前面我們介紹了神經網路的基本結構單元-感知器，現在我們再升一級，看看神經網路的基本結構和

利用Module模組把構建的神經網路跑起來

第一步 載入一個數據集

第二步 定義一個network

第三步 建立一個Module

Module的中間層次的介面

Module 高層次的API

訓練

預測和評估

訓練模型的儲存

相關推薦

第一步載入一個數據集

第二步定義一個network

第三步建立一個Module