深度學習-深度信念（置信）網路（DBN）-從原理到實現（DeepLearnToolBox）

阿新 • • 發佈：2019-01-30

深度信念網路，DBN，Deep Belief Nets，神經網路的一種。既可以用於非監督學習，類似於一個自編碼機；也可以用於監督學習，作為分類器來使用。

從非監督學習來講，其目的是儘可能地保留原始特徵的特點，同時降低特徵的維度。從監督學習來講，其目的在於使得分類錯誤率儘可能地小。而不論是監督學習還是非監督學習，DBN的本質都是Feature Learning的過程，即如何得到更好的特徵表達。

作為神經網路，神經元自然是其必不可少的組成部分。DBN由若干層神經元構成，組成元件是受限玻爾茲曼機（RBM）。

首先來了解一下受限玻爾茲曼機（RBM）：
RBM是一種神經感知器，由一個顯層和一個隱層構成，顯層與隱層的神經元之間為雙向全連線。如下圖所示：

這裡寫圖片描述

在RBM中，任意兩個相連的神經元之間有一個權值w表示其連線強度，每個神經元自身有一個偏置係數b（對顯層神經元）和c（對隱層神經元）來表示其自身權重。
這樣，就可以用下面函式表示一個RBM的能量：

E(v,h)=−ΣNvi=1bivi−ΣNhj=1cjhj−ΣNv,Nhi,j=1Wijvihj(1)
在一個RBM中，隱層神經元hj被啟用的概率：
P(hj|v)=σ(bj+ΣiWi,jxi)(2)
由於是雙向連線，顯層神經元同樣能被隱層神經元啟用：
P(vi|h)=σ(ci+ΣjWi,jhj)(3)
其中，σ 為 Sigmoid 函式，也可以設定為其他函式。
值得注意的是，當σ 為線性函式時，DBN和PCA（主成分分析）是等價的。

同一層神經元之間具有獨立性，所以概率密度亦然滿足獨立性，故得到下式：
P(h|v)=ΠNhj=1P(hj|v)(4)
P(v|h)=ΠNvi=1P(vi|h)(5)

以上即為受限玻爾茲曼機（RBM）的基本構造。其結構並不複雜。下面來看看它的工作原理：
當一條資料（如向量x）賦給顯層後，RBM根據（3）式計算出每個隱層神經元被開啟的概率P(hj|x)，j=1,2,...,Nh，取一個0-1的隨機數μ作為閾值，大於該閾值的神經元則被啟用，否則不被啟用，即：

hj=1,P(hj|x)≥μ；hj=0,P(hj|x)<μ
由此得到隱層的每個神經元是否被啟用。
給定隱層時，顯層的計算方法是一樣的。

瞭解工作原理之後就可以看看RBM是如何通過資料學習的了：
RBM共有五個引數：h、v、b、c、W，其中b、c、W，也就是相應的權重和偏置值，是通過學習得到的。（v是輸入向量，h是輸出向量）
對於一條樣本資料x，採用對比散度演算法對其進行訓練：

將x賦給顯層v1，利用（2）式計算出隱層中每個神經元被啟用的概率P(h1|v1)$；
從計算的概率分佈中採取Gibbs抽樣抽取一個樣本： h1∼P(h1|v1)
用h1重構顯層，即通過隱層反推顯層，利用（3）式計算顯層中每個神經元被啟用的概率P(v2|h1)；
同樣地，從計算得到的概率分佈中採取Gibbs抽樣抽取一個樣本： v2∼P(v2|h1)
通過v2再次計算隱層中每個神經元被啟用的概率，得到概率分佈P(h2|v2)
更新權重：

W←W+λ(P(h1|v1)v1−P(h2|v2)v2)
b←b+λ(v1−v2)
c←c+λ(h1−h2)
若干次訓練後，隱層不僅能較為精準地顯示顯層的特徵，同時還能夠還原顯層。當隱層神經元數量小於顯層時，則會產生一種“資料壓縮”的效果，也就類似於自動編碼器。

深度置信網路（DBN）：
將若干個RBM“串聯”起來則構成了一個DBN，其中，上一個RBM的隱層即為下一個RBM的顯層，上一個RBM的輸出即為下一個RBM的輸入。訓練過程中，需要充分訓練上一層的RBM後才能訓練當前層的RBM，直至最後一層。

很多的情況下，DBN是作為無監督學習框架來使用的，並且在語音識別中取得了很好的效果。

若想將DBM改為監督學習，方式有很多，比如在每個RBM中加上表示類別的神經元，在最後一層加上softmax分類器。也可以將DBM訓出的W看作是NN的pre-train，即在此基礎上通過BP演算法進行fine-tune。實際上，前向的演算法即為原始的DBN演算法，後項的更新演算法則為BP演算法，這裡，BP演算法可以是最原始的BP演算法，也可以是自己設計的BP演算法。

DBN的實現（DeepLeranToolBox）：
這裡是將DBN作為無監督學習框架來使用的，將“學習成果”賦給ANN來完成分類。

訓練集是60000張28*28的手寫數字圖片，測試集是10000張28*28的手寫數字圖片，對應的單幅圖片的特徵維度為28*28=784

% function test_example_DBN
load mnist_uint8;

train_x = double(train_x) / 255;
test_x  = double(test_x)  / 255;
train_y = double(train_y);
test_y  = double(test_y);

%%  ex2 train a 100-100 hidden unit DBN and use its weights to initialize a NN
rand('state',0)
%train dbn
%對DBN的初始化
%除了輸入層之外有兩層，每層100個神經元，即為兩個受限玻爾茲曼機
dbn.sizes = [100 100];
%訓練次數
opts.numepochs =   2;
%每次隨機的樣本數量
opts.batchsize = 100;
%更新方向，目前不知道有什麼用
opts.momentum  =   0;
%學習速率
opts.alpha     =   1;
%建立DBN
dbn = dbnsetup(dbn, train_x, opts);
%訓練DBN
dbn = dbntrain(dbn, train_x, opts);
%至此，已完成了DBN的訓練

%unfold dbn to nn
%將DBN訓練得到的資料轉化為NN的形式
nn = dbnunfoldtonn(dbn, 10);

%設定NN的閾值函式為Sigmoid函式
nn.activation_function = 'sigm';

%train nn
%訓練NN
opts.numepochs =  3;
opts.batchsize = 100;
nn = nntrain(nn, train_x, train_y, opts);
[er, bad] = nntest(nn, test_x, test_y);

assert(er < 0.10, 'Too big error');

function dbn = dbnsetup(dbn, x, opts)
    %n是單個樣本的特徵維度，784
    n = size(x, 2);
    %dbn.sizes是rbm的維度，[784 100 100]
    dbn.sizes = [n, dbn.sizes];

    %numel(dbn.sizes)返回dbn.sizes中的元素個數，對於[784 100 100]，則為3
    %初始化每個rbm
    for u = 1 : numel(dbn.sizes) - 1
        %初始化rbm的學習速率
        dbn.rbm{u}.alpha    = opts.alpha;
        %學習方向
        dbn.rbm{u}.momentum = opts.momentum;
        %第一個rbm是784-100， 第二個rbm是100-100
        %對應的連線權重，初始值全為0
        dbn.rbm{u}.W  = zeros(dbn.sizes(u + 1), dbn.sizes(u));
        %用於更新的權重，下同，不再註釋
        dbn.rbm{u}.vW = zeros(dbn.sizes(u + 1), dbn.sizes(u));
        %第一個rbm是784，第二個rbm是100
        %顯層的偏置值，初始值全為0
        dbn.rbm{u}.b  = zeros(dbn.sizes(u), 1);
        dbn.rbm{u}.vb = zeros(dbn.sizes(u), 1);
        %第一個rbm是100，第二個rbm是100
        %隱層的偏置值，初始值全為0
        dbn.rbm{u}.c  = zeros(dbn.sizes(u + 1), 1);
        dbn.rbm{u}.vc = zeros(dbn.sizes(u + 1), 1);
    end
end

function dbn = dbntrain(dbn, x, opts)
    % n = 1;
    % x = train_x，60000個樣本，每個維度為784，即60000*784
    %n為dbn中有幾個rbm，這裡n=2
    n = numel(dbn.rbm);
    %充分訓練第一個rbm
    dbn.rbm{1} = rbmtrain(dbn.rbm{1}, x, opts);
    %通過第一個rbm，依次訓練後續的rbm
    for i = 2 : n
        %建立rbm
        x = rbmup(dbn.rbm{i - 1}, x);
        %訓練rbm
        dbn.rbm{i} = rbmtrain(dbn.rbm{i}, x, opts);

function rbm = rbmtrain(rbm, x, opts)
    %矩陣x中的元素必須是浮點數，且取值為[0,1]
    assert(isfloat(x), 'x must be a float');
    assert(all(x(:)>=0) && all(x(:)<=1), 'all data in x must be in [0:1]');

    %m為樣本數量，這裡m = 60000
    m = size(x, 1);
    %訓練批次，每一批是opts.batchsize個樣本，注意這裡opts.batchsize必須整除m
    numbatches = m / opts.batchsize;

    %opts.batchsize必須能整除m
    assert(rem(numbatches, 1) == 0, 'numbatches not integer');

    %opts.numepochs，訓練次數
    for i = 1 : opts.numepochs

        %隨機打亂1-m的數，也就是1-m的隨機數，kk是1-m的隨機數向量
        kk = randperm(m);

        %訓練結果的eer
        err = 0;

        %對每一批資料進行訓練
        for l = 1 : numbatches
            %取出opts.batchsize個待訓練的樣本
            %迴圈結束後所有樣本都進行過訓練，且僅訓練了一次
            batch = x(kk((l - 1) * opts.batchsize + 1 : l * opts.batchsize), :);

            %賦值給v1
            %這裡v1是100*784的矩陣
            v1 = batch;
            %通過v1計算h1的概率，吉布斯抽樣
            h1 = sigmrnd(repmat(rbm.c', opts.batchsize, 1) + v1 * rbm.W');
            %通過h1計算v1的概率，吉布斯抽樣
            v2 = sigmrnd(repmat(rbm.b', opts.batchsize, 1) + h1 * rbm.W);
            %通過v2計算h2的概率，吉布斯抽樣
            h2 = sigm(repmat(rbm.c', opts.batchsize, 1) + v2 * rbm.W');

            %至此，h1,v1,h2,v2均已計算出來，即完成了對比散度演算法的大半，只剩下相應權重的更新

            %權重更新的差值計算
            c1 = h1' * v1;
            c2 = h2' * v2;

            rbm.vW = rbm.momentum * rbm.vW + rbm.alpha * (c1 - c2)     / opts.batchsize;
            rbm.vb = rbm.momentum * rbm.vb + rbm.alpha * sum(v1 - v2)' / opts.batchsize;
            rbm.vc = rbm.momentum * rbm.vc + rbm.alpha * sum(h1 - h2)' / opts.batchsize;

            %更新權重
            rbm.W = rbm.W + rbm.vW;
            rbm.b = rbm.b + rbm.vb;
            rbm.c = rbm.c + rbm.vc;

            %計算err
            err = err + sum(sum((v1 - v2) .^ 2)) / opts.batchsize;
        end
        %列印結果
        disp(['epoch ' num2str(i) '/' num2str(opts.numepochs)  '. Average reconstruction error is: ' num2str(err / numbatches)]);

    end
end

endend

function x = rbmup(rbm, x)
    %sigm為sigmoid函式
    %通過隱層計算下一層
    x = sigm(repmat(rbm.c', size(x, 1), 1) + x * rbm.W');
end

對於手寫數字的識別結果還是很好的，即便是最簡單的DBN+NN（如上引數設定），也可以達到95%的正確率。

必備知識來源文章：

DBN文章：

1. A Fast Learning Algorithm for Deep Belief Nets

2. The wake-sleep algorithm for unsupervised neural networks

來源：

深度學習實踐系列之--身份證上漢字及數字識別系統的實現（上）

手動 ear 常用 env 窗口 mic 文件下載 oot edr 前言：本文章將記錄我利用深度學習方法實現身份證圖像的信息識別系統的實現過程，及學習到的心得與體會。本次實踐是我投身AI的初次系統化的付諸實踐，意義重大，讓自己成長許多。終於有空閑的時間，將其

深度學習-深度信念（置信）網路（DBN）-從原理到實現（DeepLearnToolBox）

深度信念網路，DBN，Deep Belief Nets，神經網路的一種。既可以用於非監督學習，類似於一個自編碼機；也可以用於監督學習，作為分類器來使用。從非監督學習來講，其目的是儘可能地保留原始特徵的特點，同時降低特徵的維度。從監督學習來講，其目的在於使得分類錯誤率儘可能

深度學習--深度信念網路（Deep Belief Network）

本篇非常簡要地介紹了深度信念網路的基本概念。文章先簡要介紹了深度信念網路（包括其應用例項）。接著分別講述了：(1) 其基本組成結構——受限玻爾茲曼機的的基本情況，以及，(2) 這個基本結構如何組成深度信念網路。本文僅僅能使讀者瞭解深度信念網路這一概念，內容非常淺顯，甚至有許多不嚴密

深度學習 --- 深度殘差網路（ResNet）變體介紹

先說明，本文不是本人所寫，是本人翻譯得來，目的是系統整理一下，供以後深入研究時引用，如有侵權請聯絡本人刪除。 ResNet變體寬剩餘網路（WRN）：從“寬度”入手做提升： Wide Residual Network（WRN）由Sergey Zagoruyko和Nikos Komod

深度學習 --- 深度卷積神經網路詳解（AlexNet 網路詳解）

本篇將解釋另外一個卷積神經網路，該網路是Hinton率領的谷歌團隊（Alex Krizhevsky，Ilya Sutskever，Geoffrey E. Hinton）在2010年的ImageNet大賽獲得冠軍的一個神經網路，因此本節主要參考的論文也是這次大賽的論文即“Imag

吳恩達Coursera深度學習課程筆記（1-1）神經網路和深度學習-深度學習概論

這系列文章是我在學習吳恩達教授深度學習課程時為了加深自己理解，同時方便後來對內容進行回顧而做的筆記，其中難免有錯誤的理解和不太好的表述方式，歡迎各位大佬指正並提供建議。1、什麼是神經網路在簡單的從房屋面積預測價格時，神經網路可以理解為將輸入的房屋

深度學習小白——卷積神經網路視覺化（二）

一、由卷積後的code得到原始影象可以看出隨著卷積網路的進行，越來越多的資訊被扔掉了，能還原除的資訊也就越少。二、Deep Dream google發明的起初是用來看神經網路各層在“看”什麼，後來因為得到的影象很具有藝術感，所以成為了一個藝術圖片生成器。這是一

第五章（1.6）深度學習——常用的八種神經網路效能調優方案

一、神經網路效能調優主要方法資料增廣影象預處理網路初始化訓練過程中的技巧啟用函式的選擇不同正則化方法來自於資料的洞察整合多個深度網路 1. 資料增廣在不改變影象類別的情況下，增加資料量，能提高模型的泛化能力。自然影象的資料增廣方式

深度學習【6】二值網路（Binarized Neural Networks）學習與理解

http://blog.csdn.net/linmingan/article/details/51008830 Binarized Neural Networks: Training Neural Networks with Weights and Ac

深入淺出神經網路與深度學習--神經元感知機單層神經網路介紹（-）

1 概述寫神經網路與深度學習方面的一些知識，是一直想做的事情。但本人比較懶惰，有點時間想玩點遊戲呀什麼的，一直拖到現在。也由於現在已經快當爸了，心也沉了下來，才能去梳理一些東西。本文會深入檢出的去看神經網路與深度學習的一些知識，包含一些演算法、基礎等，比較適合初學者。

UFLDL教程筆記及練習答案四（建立分類用深度學習---棧式自編碼神經網路）

此次主要由自我學習過度到深度學習，簡單記錄如下： (1)深度學習比淺層網路學習對特徵具有更優異的表達能力和緊密簡潔的表達了比淺層網路大的多的函式集合。 (2)將傳統的淺層神經網路進行擴充套件會存在資料獲取、區域性最值和梯度彌散的缺點。 (3)棧式自編碼神經網路是由多層稀疏自

吳恩達【深度學習工程師】 04.卷積神經網絡第三周目標檢測（1）基本的對象檢測算法

元素需要有關卷積訓練特定步長來看選擇該筆記介紹的是《卷積神經網絡》系列第三周：目標檢測（1）基本的對象檢測算法主要內容有： 1.目標定位 2.特征點檢測 3.目標檢測目標定位使用算法判斷圖片中是不是目標物體，如果是還要再圖片中標出其位置並

基於深度學習的CT影象肺結節自動檢測技術一——資料預處理（歸一化，資料增強，資料標記）

開發環境 Anaconda:jupyter notebook /pycharm pip install SimpleItk # 讀取CT醫學影象 pip install tqdm # 可擴充套件的Python進度條，封裝

深度學習系列文章之二上：win7+Ubantu雙系統裝機步驟（硬碟安裝）

一次上傳總是傳不上去，所以將安裝步驟分為上中下三篇上傳。 64位Win7系統下安裝ubantu14.04雙系統一.安裝所需軟體 1、分割槽助手專業版(必需)：用來對硬碟分割槽，將磁碟的一部分格式化成Linux可以識別的ext3格式。 2、Ext2Fsd(硬碟安裝必需，光

深度學習筆記——理論與推導之Structured Learning【Markov Random Field】（十）

Graphical Model & Gibbs Sampling(Sturctured Learning) Graphical Model是Structured Learning中的一種。 Structured Learning複習

Deep Learning 8_深度學習UFLDL教程：Stacked Autocoders and Implement deep networks for digit classification_Exercise（斯坦福大學深度學習教程）

前言 2.實驗環境：win7， matlab2015b，16G記憶體，2T硬碟 3.實驗內容：Exercise: Implement deep networks for digit classification。利用深度網路完成MNIST手寫數字資料庫中手寫數字的識別。即：用6萬個已標註資料（即：6萬

深度學習-深度信念（置信）網路（DBN）-從原理到實現（DeepLearnToolBox）

深度學習實踐系列之--身份證上漢字及數字識別系統的實現（上）

深度學習-深度信念（置信）網路（DBN）-從原理到實現（DeepLearnToolBox）

深度學習--深度信念網路（Deep Belief Network）

深度學習 --- 深度殘差網路（ResNet）變體介紹

深度學習 --- 深度卷積神經網路詳解（AlexNet 網路詳解）

吳恩達Coursera深度學習課程筆記（1-1）神經網路和深度學習-深度學習概論

深度學習小白——卷積神經網路視覺化（二）

第五章（1.6）深度學習——常用的八種神經網路效能調優方案

深度學習【6】二值網路（Binarized Neural Networks）學習與理解

深入淺出神經網路與深度學習--神經元感知機單層神經網路介紹（-）

UFLDL教程筆記及練習答案四（建立分類用深度學習---棧式自編碼神經網路）

吳恩達【深度學習工程師】 04.卷積神經網絡第三周目標檢測（1）基本的對象檢測算法

基於深度學習的CT影象肺結節自動檢測技術一——資料預處理（歸一化，資料增強，資料標記）

深度學習系列文章之二上：win7+Ubantu雙系統裝機步驟（硬碟安裝）

深度學習筆記——理論與推導之Structured Learning【Markov Random Field】（十）

Deep Learning 8_深度學習UFLDL教程：Stacked Autocoders and Implement deep networks for digit classification_Exercise（斯坦福大學深度學習教程）

機器學習、深度學習、計算機視覺、自然語言處理及應用案例——乾貨分享（持續更新......）

Spark MLlib Deep Learning Deep Belief Network (深度學習-深度信念網路)2.2

深度學習系列文章之二下：win7+Ubantu雙系統裝機步驟（硬碟安裝）

Spark MLlib Deep Learning Deep Belief Network (深度學習-深度信念網路)2.3

深度學習-深度信念（置信）網路（DBN）-從原理到實現（DeepLearnToolBox）

相關推薦