深度學習Deeplearning4j 入門實戰（5）：基於多層感知機的Mnist壓縮以及在Spark實現

阿新 • • 發佈：2019-01-23

在上一篇部落格中，我們用基於RBM的的Deep AutoEncoder對Mnist資料集進行壓縮，應該說取得了不錯的效果。這裡，我們將神經網路這塊替換成傳統的全連線的前饋神經網路對Mnist資料集進行壓縮，看看兩者的效果有什麼異同。整個程式碼依然是利用Deeplearning4j進行實現，並且為了方便以後的擴充套件，我們將其與Spark平臺結合。下面，就具體來說一下模型的結構、訓練過程以及最終的壓縮效果。

首先，我們新建Maven工程並加入Deeplearning4j的相關依賴（這一塊內容在之前的文章中多次提及，因此這裡就不再囉嗦了）。接下來，我們新建Spark任務，讀取已經存放在HDFS上的Mnist資料集（和之前文章中提到的一樣，Mnist資料集已經事先以JavaRDD<DataSet>的形式儲存在HDFS上，具體操作可以參考之前的部落格。），並生成訓練資料集JavaRDD。具體程式碼如下：

SparkConf conf = new SparkConf()
.set("spark.kryo.registrator", "org.nd4j.Nd4jRegistrator")
.setAppName("MLP AutoEncoder Mnist(Java)");
JavaSparkContext jsc = new JavaSparkContext(conf);
//
final String inputPath = args[0];
final String savePath = args[

1];
double lr = Double.parseDouble(args[2]);
finalint batchSize = Integer.parseInt(args[3]);
finalint numEpoch = Integer.parseInt(args[4]);
//
JavaRDD<DataSet> javaRDDMnist = jsc.objectFile(inputPath);//read mnist data from HDFS
JavaRDD<DataSet> javaRDDTrain = javaRDDMnist.map(new Function<DataSet, DataSet>() {
@Override
public DataSet call(DataSet next) throws Exception {
returnnew DataSet(next.getFeatureMatrix(),next.getFeatureMatrix());
}
});

構築完訓練資料集之後，我們就可以定義網路結構並配以相應的超引數：

MultiLayerConfiguration netconf = new NeuralNetConfiguration.Builder()
.seed(123)
.iterations(1)
.learningRate(lr)
.learningRateScoreBasedDecayRate(0.5)
.optimizationAlgo(OptimizationAlgorithm.STOCHASTIC_GRADIENT_DESCENT)
.updater(Updater.ADAM).adamMeanDecay(0.9).adamVarDecay(0.999)
.list()
.layer(0, new DenseLayer.Builder().nIn(784).nOut(1000).activation("relu").build())
.layer(1, new DenseLayer.Builder().nIn(1000).nOut(500).activation("relu").build())
.layer(2, new DenseLayer.Builder().nIn(500).nOut(250).activation("relu").build())
.layer(3, new DenseLayer.Builder().nIn(250).nOut(500).activation("relu").build())
.layer(4, new DenseLayer.Builder().nIn(500).nOut(1000).activation("relu").build())
.layer(5, new OutputLayer.Builder(LossFunctions.LossFunction.MSE)
.nIn(1000)
.nOut(784)
.activation("relu")
.build())
.backprop(true).pretrain(false)
.build();
ParameterAveragingTrainingMaster trainMaster = new ParameterAveragingTrainingMaster.Builder(batchSize)
.workerPrefetchNumBatches(0)
.saveUpdater(true)
.averagingFrequency(5)
.batchSizePerWorker(batchSize)
.build();
MultiLayerNetwork net = new MultiLayerNetwork(netconf);
net.init();
SparkDl4jMultiLayer sparkNetwork = new SparkDl4jMultiLayer(jsc, net, trainMaster);
sparkNetwork.setListeners(Collections.<IterationListener>singletonList(new ScoreIterationListener(1)));

這裡我們做一些簡要的說明：我們一共定義了5層的神經網路，並且每一層都是普通的全連線網路。學習率等超引數可以通過入口引數傳遞進來，損失函式用的是均方誤差。後面的ParameterAveragingTrainingMaster以及Spark網路的定義在之前的文章中有過說明，這裡就略過了。

那麼，接下來就是訓練的程式碼：

for( int i = 0; i < numEpoch; ++i ){
sparkNetwork.fit(javaRDDTrain); //train modek
System.out.println("----- Epoch " + i + " complete -----");
MultiLayerNetwork trainnet = sparkNetwork.getNetwork();
System.out.println("Epoch " + i + " Score: " + sparkNetwork.getScore());
List<DataSet> listDS = javaRDDTrain.takeSample(false, 50);
for( DataSet ds : listDS ){
INDArray testFeature = ds.getFeatureMatrix();
INDArray testRes = trainnet.output(testFeature);
System.out.println("Euclidean Distance: " + testRes.distance2(testFeature));
}
DataSet first = listDS.get(0);
INDArray testFeature = first.getFeatureMatrix();
double[] doubleFeature = testFeature.data().asDouble();
INDArray testRes = trainnet.output(testFeature);
double[] doubleRes = testRes.data().asDouble();
for( int j = 0; j < doubleFeature.length && j < doubleRes.length; ++j ){
double f = doubleFeature[j]; double t = doubleRes[j];
System.out.print(f + ":" + t + " ");
}
System.out.println();
}

訓練過程中我們將在每一輪訓練結束後隨機抽取一些資料進行預測，並將預測值和原值進行歐氏距離的計算。同時我們也會隨機抽取一張圖片直接比較每個畫素點值的不同。具體可以看下面的兩張圖：

完整的訓練過程，Spark任務截圖：

隨機抽取的資料的比較：

在經過多輪次的訓練後，我們將模型儲存在HDFS上（具體的程式碼實現可以參考之前的部落格）並且將其拉到本地後，隨機預測/重構一些圖片來看看效果，具體的，我隨機選擇了9張圖進行重構，如下圖：

最後做下小結。

這裡我們用多層感知機來對Mnsit資料集進行壓縮，並且也取得不錯的壓縮效果。和之前利用Deep AutoEncoder進行資料進行壓縮的不同在於我們將每一層中RBM替換成了FNN。應當說，從肉眼的角度我們沒法分辨兩種網路對Mnist資料集壓縮的好壞程度，但是從理論上，基於RBM的壓縮網路應該會取得更好的效果，在Hinton教授的論文中，也拿兩者做了比較，結論也是基於RBM的Deep AutoEncoder效果更好，實際中，兩者都會應用到。所以還得還情況而定！

深度學習Deeplearning4j 入門實戰（5）：基於多層感知機的Mnist壓縮以及在Spark實現

在上一篇部落格中，我們用基於RBM的的Deep AutoEncoder對Mnist資料集進行壓縮，應該說取得了不錯的效果。這裡，我們將神經網路這塊替換成傳統的全連線的前饋神經網路對Mnist資料集進行壓縮，看看兩者的效果有什麼異同。整個程式碼依然是利用Deeplearnin

Deeplearning4j 實戰（5）：基於多層感知機的Mnist壓縮以及在Spark實現

在上一篇部落格中，我們用基於RBM的的Deep AutoEncoder對Mnist資料集進行壓縮，應該說取得了不錯的效果。這裡，我們將神經網路這塊替換成傳統的全連線的前饋神經網路對Mnist資料集進行壓縮，看看兩者的效果有什麼異同。整個程式碼依然是利用Deeplearning4j進行實現，並且為了方

深度學習入門實戰（二）：用TensorFlow訓練線性迴歸

0x00 概要 TensorFlow是谷歌爸爸出的一個開源機器學習框架，目前已被廣泛應用，谷歌爸爸出品即使效能不是最強的（其實效能也不錯），但絕對是用起來最方便的，畢竟谷歌有Jeff Dean坐鎮，這波穩。 0x01 TensorFlow安裝官方有一個Mac上Te

深度學習之PyTorch實戰（3）——實戰手寫數字識別

　　上一節，我們已經學會了基於PyTorch深度學習框架高效，快捷的搭建一個神經網路，並對模型進行訓練和對引數進行優化的方法，接下來讓我們牛刀小試，基於PyTorch框架使用神經網路來解決一個關於手寫數字識別的計算機視覺問題，評價我們搭建的模型的標準是它是否能準確的對手寫數字圖片進行識別。　　

改善深層神經網路——深度學習的實用層面（5）

目錄正則化偏差大的解決辦法：在正則化引數合適的情況下增大網路（不影響方差）方差大解決辦法：調整正則化引數或者準備更多資料增大資料集（不影響偏差）正則化邏輯迴歸正則化：神經網路正則化： 6.Dropout正則化除

深度學習分散式訓練實戰（一）

本系列部落格主要介紹使用Pytorch和TF進行分散式訓練，本篇重點介紹相關理論，分析為什麼要進行分散式訓練。後續會從程式碼層面逐一介紹實際程式設計過程中如何實現分散式訓練。常見的訓練方式單機單卡（單GPU）這種訓練方式一般就是在自己筆記本上，窮學生專

深度學習分散式訓練實戰（二）——TF

本篇部落格主要介紹TF的分散式訓練，重點從程式碼層面進行講解。理論部分可以參考深度學習分散式訓練實戰（一) TF的分散式實現方式 TF的分散式有兩種實現方式，一種是圖內分散式（In-graph replication）；一種是圖間分散式(Between-gra

深度學習之PyTorch實戰（1）——基礎學習及搭建環境

　　最近在學習PyTorch框架，買了一本《深度學習之PyTorch實戰計算機視覺》，從學習開始，小編會整理學習筆記，並部落格記錄，希望自己好好學完這本書，最後能熟練應用此框架。　　PyTorch是美國網際網路巨頭Facebook在深度學習框架Torch的基礎上使用Python重寫的一個全新的深度學習框架，

深度學習之PyTorch實戰（2）——神經網路模型搭建和引數優化

　　上一篇部落格先搭建了基礎環境，並熟悉了基礎知識，本節基於此，再進行深一步的學習。　　接下來看看如何基於PyTorch深度學習框架用簡單快捷的方式搭建出複雜的神經網路模型，同時讓模型引數的優化方法趨於高效。如同使用PyTorch中的自動梯度方法一樣，在搭建複雜的神經網路模型的時候，我們也可以使用PyTor

深度學習與TensorFlow實戰（一）深度學習基本概述

傳統的機器學習演算法例如SVM、Boosting、最大熵、LR都屬於淺層的機器學習模型，這些模型只有一層隱藏節點，或者沒有隱藏節點（LR），其侷限在於有限樣本和計算單單元對複雜函式的表示能力有限，泛化能力的侷限性也較大。深度學習可以通過學習深層非線性網路結構，實

深度學習論文翻譯解析（一）：YOLOv3: An Incremental Improvement

cluster tina ble mac 曾經 media bject batch 因此原標題： YOLOv3: An Incremental Improvement 原作者： Joseph Redmon Ali Farhadi YOLO官網：YOLO: Real-Tim

深度學習論文翻譯解析（二）：An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition

論文標題：An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition 論文作者： Baoguang Shi, Xiang B

深度學習Deeplearning4j 入門實戰（5）：基於多層感知機的Mnist壓縮以及在Spark實現

深度學習Deeplearning4j 入門實戰（5）：基於多層感知機的Mnist壓縮以及在Spark實現

Deeplearning4j 實戰（5）：基於多層感知機的Mnist壓縮以及在Spark實現

深度學習入門實戰（二）：用TensorFlow訓練線性迴歸

深度學習之PyTorch實戰（3）——實戰手寫數字識別

改善深層神經網路——深度學習的實用層面（5）

深度學習分散式訓練實戰（一）

深度學習分散式訓練實戰（二）——TF

深度學習之PyTorch實戰（1）——基礎學習及搭建環境

深度學習之PyTorch實戰（2）——神經網路模型搭建和引數優化

深度學習與TensorFlow實戰（一）深度學習基本概述

深度學習論文翻譯解析（一）：YOLOv3: An Incremental Improvement

深度學習論文翻譯解析（二）：An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition

深度學習論文翻譯解析（三）：Detecting Text in Natural Image with Connectionist Text Proposal Network

arcgis jsapi介面入門系列（5）：幾何（點線面）基本操作

深度學習論文翻譯解析（四）：Faster R-CNN: Down the rabbit hole of modern object detection

Deeplearning4j 實戰（11）：基於Nd4j的線性迴歸模型的實現

Deeplearning4j 實戰（6）：基於LSTM的文字情感識別及其Spark實現

Keras入門實戰（1）：MNIST手寫數字分類

Asp.Net MVC4入門指南（5）：從控制器訪問資料模型

ASP.NET AJAX入門系列（5）：使用UpdatePanel控制元件（二）

深度學習Deeplearning4j 入門實戰（5）：基於多層感知機的Mnist壓縮以及在Spark實現

相關推薦