簡單易學的機器學習演算法——受限玻爾茲曼機RBM

阿新 • • 發佈：2022-05-04

受限玻爾茲曼機(Restricted Boltzmann Machine, RBM)是一種基於能量模型的神經網路模型，在Hinton提出針對其的訓練演算法(對比分歧演算法)後，RBM得到了更多的關注，利用RBM的堆疊可以構造出深層的神經網路模型——深度信念網(Deep Belief Net, DBN)。下面簡單介紹二值型RBM的主要內容。

一、RBM的網路結構

RBM的網路結構如下圖所示：

RBM中包括兩層，即：

可見層(visible layer)，圖上的vmathbf{v}
隱藏層(hidden layer)，圖上的hmathbf{h}

由上圖可知，在同一層中，如上圖中的可見層，在可見層中，其節點之間是沒有連線的，而在層與層之間，其節點是全連線的，這是RBM最重要的結構特徵：層內無連線，層間全連線

。

在RBM的模型中，有如下的性質：

當給定可見層神經元的狀態時。各隱藏層神經元的之間是否啟用是條件獨立的；反之也同樣成立。

下面給出RBM模型的數學化定義：

如圖：

(圖片來自參考文獻1)

二、RBM模型的計算

2.1、能量函式

2.2、啟用概率

2.3、模型的訓練

2.3.1、模型的優化函式

2.3.2、最大似然的求解

2.3.3、優化求解

三、實驗

實驗程式碼

# coding:UTF-8

import numpy as np
import random as rd

def load_data(file_name):
    data = []
    f = open(file_name)
    for line in f.readlines():
        lines = line.strip().split("t")
        tmp = []
        for x in lines:
            tmp.append(float(x) / 255.0)
        data.append(tmp)
    f.close()
    return data

def sigmrnd(P):
    m, n = np.shape(P)
    X = np.mat(np.zeros((m, n)))
    P_1 = sigm(P)
    for i in xrange(m):
        for j in xrange(n):
            r = rd.random()
            if P_1[i, j] >= r:
                X[i, j] = 1

    return X

def sigm(P):
    return 1.0 / (1 + np.exp(-P))         


# step_1: load data    
datafile = "b.txt"
data = np.mat(load_data(datafile))
m, n = np.shape(data)

# step_2: initialize
num_epochs = 10
batch_size = 100
input_dim = n

hidden_sz = 100

alpha = 1
momentum = 0.1
W = np.mat(np.zeros((hidden_sz, input_dim)))
vW = np.mat(np.zeros((hidden_sz, input_dim)))
b = np.mat(np.zeros((input_dim, 1)))
vb = np.mat(np.zeros((input_dim, 1)))
c = np.mat(np.zeros((hidden_sz, 1)))
vc = np.mat(np.zeros((hidden_sz, 1)))

# step_3: training
print "Start to train RBM: "

num_batches = int(m / batch_size)
for i in xrange(num_epochs):
    kk = np.random.permutation(range(m))
    err = 0.0

    for j in xrange(num_batches):
        batch = data[kk[j * batch_size:(j + 1) * batch_size], ]

    v1 = batch
        h1 = sigmrnd(np.ones((batch_size, 1)) * c.T + v1 * W.T)
        v2 = sigmrnd(np.ones((batch_size, 1)) * b.T + h1 * W)
        h2 = sigm(np.ones((batch_size, 1)) * c.T + v2 * W.T)

        c1 = h1.T * v1
        c2 = h2.T * v2

        vW = momentum * vW + alpha * (c1 - c2) / batch_size
        vb = momentum * vb + alpha * sum(v1 - v2).T / batch_size
        vc = momentum * vc + alpha * sum(h1 - h2).T / batch_size

        W = W + vW
        b = b + vb
        c = c + vc

    #cal_err
    err_result = v1 - v2
        err_1 = 0.0
    m_1, n_1 = np.shape(err_result)
    for x in xrange(m_1):
            for y in xrange(n_1):
            err_1 = err_1 + err_result[x, y] ** 2

        err = err + err_1 / batch_size
    #print i,j,err

    print i, err / num_batches

#print W

m_2,n_2 = np.shape(W)

for i in xrange(m_2):
    for j in xrange(n_2):
        print str(W[i, j]) + " ",
    print "n",

參考文獻

簡單易學的機器學習演算法——受限玻爾茲曼機RBM

受限玻爾茲曼機(Restricted Boltzmann Machine, RBM)是一種基於能量模型的神經網路模型，在Hinton提出針對其的訓練演算法(對比分歧演算法)後，RBM得到了更多的關注，利用RBM的堆疊可以構造出深層的神經網路模型——深

20201010_玻爾茲曼機_觀看覃秉豐課程筆記

視訊錄製於2017年一、玻爾茲曼機理解起來要複雜一些，比BP網路，卷積神經網路，殘差神經網路，LSTM遞迴神經網路等理解起來還要難一些。儘管玻爾茲曼機複雜但是還是很重要的，在2016年一片深度學習奠基性的

簡單易學的機器學習演算法——K-Means++演算法

一、K-Means演算法存在的問題由於K-Means演算法的簡單且易於實現，因此K-Means演算法得到了很多的應用，但是從K-Means演算法的過程中發現，K-Means演算法中的聚類中心的個數k需要事先指定，這一點對於一些未知資料存

簡單易學的機器學習演算法——K-近鄰演算法

一、近鄰演算法(Nearest Neighbors) 1、近鄰演算法的概念近鄰演算法(Nearest Neighbors)是一種典型的非參模型，與生成方法(generalizing method)不同的是，在近鄰演算法中，通過以例項的形式儲存所有的訓練樣本，假

簡單易學的機器學習演算法——線性迴歸(1)

一、線性迴歸的概念對連續型資料做出預測屬於迴歸問題。舉個簡單的例子：例如我們在知道房屋面積(HouseArea)和臥室的數量(Bedrooms)的情況下要求房屋的價格(Price)。通過一組資料，我們得到了這樣的關係：

簡單易學的機器學習演算法——線性迴歸(2)

一、基本線性迴歸模型的抽象在基本的線性迴歸中(可見簡單易學的機器學習演算法——線性迴歸(1))，對於一個線性迴歸為題，我們得到一個線性方程組：

簡單易學的機器學習演算法——Rosenblatt感知機

一、感知機的概念二、感知機模型的訓練 1、目標函式 2、感知機的訓練過程

簡單易學的機器學習演算法——Logistic迴歸

一、Logistic迴歸的概述 Logistic迴歸是一種簡單的分類演算法，提到“迴歸”，很多人可能覺得與分類沒什麼關係，Logistic迴歸通過對資料分類邊界的擬合來實現分類。而“迴歸”也就意味著最佳擬合。要進行最佳擬

簡單易學的機器學習演算法——極限學習機(ELM)

一、極限學習機的概念極限學習機(Extreme Learning Machine) ELM，是由黃廣斌提出來的求解單隱層神經網路的演算法。

簡單易學的機器學習演算法——分類迴歸樹CART

引言分類迴歸樹（Classification and Regression Tree，CART）是一種典型的決策樹演算法，CART演算法不僅可以應用於分類問題，而且可以用於迴歸問題。

簡單易學的機器學習演算法——線上順序極限學習機OS-ELM

這篇文章主要是前面整理的，就直接上圖了。實驗： # coding:UTF-8 #################

簡單易學的機器學習演算法——Softmax Regression

一、Softmax Regression簡介 Softmax Regression是Logistic迴歸的推廣，Logistic迴歸是處理二分類問題的，而SoftmaxRegression是處理多分類問題的。Logistic迴歸是處理二分類問題的比較好的演算法，具

簡單易學的機器學習演算法——Apriori演算法

一、關聯分析最初接觸到資料探勘的朋友肯定都聽說過這樣的一個案例：啤酒和尿布。大意是將啤酒和尿布放在一起的銷售會提高。其實這背後隱含的原理就是關聯分析，簡單來講就是啤酒和尿布之間存在著某種關聯關係

簡單易學的機器學習演算法——lasso

一、lasso 二、前向逐步迴歸前向逐步迴歸演算法可以得到與lasso差不多的效果，但是前向逐步迴歸更加簡單。這是一種貪心演算法，在每一步儘量減少誤差。

簡單易學的機器學習演算法——EM演算法

一、機器學習中的引數估計問題二、EM演算法簡介在上述存在隱變數的問題中，不能直接通過極大似然估計求出模型中的引數，EM演算法是一種解決存在隱含變數優化問題的有效方法。EM演算法是期望極大(Expectation

簡單易學的機器學習演算法——AdaBoost

一、整合方法(Ensemble Method) 整合方法主要包括Bagging和Boosting兩種方法，隨機森林演算法是基於Bagging思想的機器學習演算法，在Bagging方法中，主要通過對訓練資料集進行隨機取樣，以重新組合成不同的資料

簡單易學的機器學習演算法——因子分解機(Factorization Machine)

一、因子分解機FM的模型因子分解機(Factorization Machine, FM)是由Steffen Rendle提出的一種基於矩陣分解的機器學習演算法。

簡單易學的機器學習演算法——Mean Shift聚類演算法

一、Mean Shift演算法概述 Mean Shift演算法，又稱為均值漂移演算法，Mean Shift的概念最早是由Fukunage在1975年提出的，在後來由Yizong Cheng對其進行擴充，主要提出了兩點的改進：

簡單易學的機器學習演算法——Metropolis-Hastings演算法

在簡單易學的機器學習演算法——馬爾可夫鏈蒙特卡羅方法MCMC中簡單介紹了馬爾可夫鏈蒙特卡羅MCMC方法的基本原理，介紹了Metropolis取樣演算法的基本過程，這一部分，主要介紹Metropolis-Hastings取樣演算法，Metropo

簡單易學的機器學習演算法——Gibbs取樣

一、Gibbs取樣概述前面介紹的Metropolis-Hastings取樣為從指定分佈中進行取樣提供了一個統一的框架，但是取樣的效率依賴於指定的分佈的選擇，若是選擇的不好，會使得接受率比較低，大量的取樣被拒絕，影響到整體的收

簡單易學的機器學習演算法——受限玻爾茲曼機RBM

一、RBM的網路結構

二、RBM模型的計算

2.1、能量函式

2.2、啟用概率

2.3、模型的訓練

2.3.1、模型的優化函式

2.3.2、最大似然的求解

2.3.3、優化求解

三、實驗

參考文獻

相關推薦