機器學習演算法▬▬▬極速學習機

阿新 • • 發佈：2018-12-31

一、極限學習機的概念

極限學習機(Extreme Learning Machine) ELM，是由黃廣斌提出來的求解單隱層神經網路的演算法。

ELM最大的特點是對於傳統的神經網路，尤其是單隱層前饋神經網路(SLFNs)，在保證學習精度的前提下比傳統的學習演算法速度更快。

二、極限學習機的原理

ELM是一種新型的快速學習演算法，對於單隱層神經網路，ELM 可以隨機初始化輸入權重和偏置並得到相應的輸出權重。

(選自黃廣斌老師的PPT)

對於一個單隱層神經網路(見Figure 1)，假設有 $N$ 個任意的樣本 $\left ( X_i,t_i \right )$ ，其中 $X_i=\left [ x_{i1},x_{i2},\cdots,x_{in} \right ]^T\in R^n$ ， $t_i=\left [ t_{i1},t_{i2},\cdots,t_{im} \right ]^T\in R^m$ 。對於一個有 $L$ 個隱層節點的單隱層神經網路可以表示為

$\sum_{i=1}^{L}\beta _ig\left ( W_i\cdot X_j+b_i \right )=o_j,\; j=1,\cdots,N$

其中， $g\left ( x \right )$

為啟用函式， $W_i=\left [ w_{i,1},w_{i,2},\cdots,w_{i,n} \right ]^T$ 為輸入權重， $\beta _i$ 為輸出權重， $b _i$ 是第 $i$ 個隱層單元的偏置。 $W_i\cdot X_j$ 表示 $W_i$ 和 $X_j$ 的內積。

單隱層神經網路學習的目標是使得輸出的誤差最小，可以表示為

$\sum_{j=1}^{N}\left \| o_j-t_j \right \|=0$

即存在 $\beta _i$ ， $W _i$ 和 $b _i$ ，使得

$\sum_{i=1}^{L}\beta _ig\left (W_i\cdot X _j+b _i\right )=t _j,\; j=1,\cdots,N$

可以矩陣表示為

$H\beta =T$

其中， $H$ 是隱層節點的輸出， $\beta$ 為輸出權重， $T$ 為期望輸出。

$H\left ( W_1,\cdots,W_L,b_1,\cdots,b_L,X_1,\cdots,X_L \right )$

$= \begin{bmatrix} g\left ( W_1\cdot X_1+b_1 \right ) & \cdots & g\left ( W_L\cdot X_1+b_L \right )\\ \vdots & \cdots & \vdots\\ g\left ( W_1\cdot X_N+b_1 \right ) & \cdots & g\left ( W_L\cdot X_N+b_L \right ) \end{bmatrix}_{N\times L}$

$\beta =\begin{bmatrix} \beta^{T} _1\\ \vdots \\ \beta^{T} _L \end{bmatrix}_{L\times m}$ ， $T =\begin{bmatrix} T^{T} _1\\ \vdots \\ T^{T} _N \end{bmatrix}_{N\times m}$

為了能夠訓練單隱層神經網路，我們希望得到 $\hat{W_i}$ ， $\hat{b_i}$ 和 $\hat{\beta _i}$ ，使得

$\left \| H\left ( \hat{W_i},\hat{b_i} \right ) \hat{\beta _i}-T\right \|=\underset{W,b,\beta}{min} \left \| H\left ( W_i,b_i\right )\beta_i-T \right \|$

其中， $i=1,\cdots,L$ ，這等價於最小化損失函式

$E=\sum_{j=1}^{N}\left ( \sum_{i=1}^{L}\beta_i g\left ( W_i\cdot X_j + b_i \right )-t_j \right )^2$

傳統的一些基於梯度下降法的演算法，可以用來求解這樣的問題，但是基本的基於梯度的學習演算法需要在迭代的過程中調整所有引數。而在ELM演算法中, 一旦輸入權重 $W _i$ 和隱層的偏置 $b _i$ 被隨機確定，隱層的輸出矩陣 $H$ 就被唯一確定。訓練單隱層神經網路可以轉化為求解一個線性系統

$H\beta =T$ 。並且輸出權重 $\beta$ 可以被確定

$\hat{\beta}=H^{\dagger }T$

其中， $H^{\dagger }$ 是矩陣 $H$ 的Moore-Penrose廣義逆。且可證明求得的解 $\hat{\beta}$ 的範數是最小的並且唯一。

三、實驗

原始資料集我們採用統計錯誤率的方式來評價實驗的效果，其中錯誤率公式為： $errorRate=\frac{NumError}{NumAll}$ 對於這樣一個簡單的問題， $errorRate=0$ 。 MATLAB程式碼主程式

%% 主函式，二分類問題
%匯入資料集
A = load('testSet.txt');
data = A(:,1:2);%特徵
label = A(:,3);%標籤
[N,n] = size(data);
L = 100;%隱層節點個數
m = 2;%要分的類別數
%--初始化權重和偏置矩陣
W = rand(n,L)*2-1;
b_1 = rand(1,L);
ind = ones(N,1);
b = b_1(ind,:);%擴充成N*L的矩陣
tempH = data*W+b;
H = g(tempH);%得到H
%對輸出做處理
temp_T=zeros(N,m);
for i = 1:N
if label(i,:) == 0
temp_T(i,1) = 1;
else
temp_T(i,2) = 1;
end
end
T = temp_T*2-1;
outputWeight = pinv(H)*T;
%--畫出圖形
x_1 = data(:,1);
x_2 = data(:,2);
hold on
for i = 1 : N
if label(i,:) == 0
plot(x_1(i,:),x_2(i,:),'.g');
else
plot(x_1(i,:),x_2(i,:),'.r');
end
end
output = H * outputWeight;
%---計算錯誤率
tempCorrect=0;
for i = 1:N
[maxNum,index] = max(output(i,:));
index = index-1;
if index == label(i,:);
tempCorrect = tempCorrect+1;
end
end
errorRate = 1-tempCorrect./N;

啟用函式

function [ H ] = g( X )
H = 1 ./ (1 + exp(-X));
end

黃老師提供的極限學習機的程式碼：點選開啟連結

機器學習演算法▬▬▬極速學習機

一、極限學習機的概念

二、極限學習機的原理

三、實驗

機器學習演算法▬▬▬極速學習機

機器學習演算法——SVM(支援向量機)

【資料科學系統學習】機器學習演算法 # 西瓜書學習記錄 [7] 支援向量機（一）

【資料科學系統學習】機器學習演算法 # 西瓜書學習記錄 [8] 支援向量機（二）

【資料科學系統學習】機器學習演算法 # 西瓜書學習記錄 [9] 決策樹

【資料科學系統學習】機器學習演算法 # 西瓜書學習記錄 [10] 決策樹實踐

【資料科學系統學習】機器學習演算法 # 西瓜書學習記錄 [11] 整合學習

【資料科學系統學習】機器學習演算法 # 西瓜書學習記錄 [12] 整合學習實踐

機器學習演算法與Python學習

新興機器學習演算法：遷移學習

麻將胡牌演算法極速(速度接近理論極限)

教你6步從頭寫機器學習演算法——以感知機演算法為例

機器學習演算法——支援向量機svm，實現過程

機器學習---演算法---支援向量機---線性SVM--第一部分

【機器學習演算法推導】支援向量機

簡單易學的機器學習演算法——因子分解機(Factorization Machine)

【機器學習演算法-python實現】svm支援向量機(3)—核函式

機器學習演算法及程式碼實現--支援向量機

機器學習實戰-55:支援向量機分類演算法(Support Vector Machine)

感知機學習演算法（PLA）的修正過程的理解（機器學習基石）

機器學習演算法▬▬▬極速學習機

一、極限學習機的概念

二、極限學習機的原理

三、實驗

相關推薦