模擬退火(Simulated Annealing, SA)演算法簡介與MATLAB實現

阿新 • • 發佈：2019-01-03

演算法步驟

演算法特點

模擬退火演算法概述

模擬退火演算法(Simulated Annealing，簡稱SA)的思想最早是由Metropolis等提出的。其出發點是基於物理中固體物質的退火過程與一般的組合優化問題之間的相似性。模擬退火法是一種通用的優化演算法，其物理退火過程由以下三部分組成:
- 加溫過程。其目的是增強粒子的熱運動，使其偏離平衡位置。當溫度足夠高時，固體將熔為液體，從而消除系統原先存在的非均勻狀態。
- 等溫過程。對於與周圍環境交換熱量而溫度不變的封閉系統，系統狀態的自發變化總是朝自由能減少的方向進行的，當自由能達到最小時，系統達到平衡狀態
  
  。
- 冷卻過程。使粒子熱運動減弱，系統能量下降，得到晶體結構。
加溫過程相當於對演算法設定初值，等溫過程對應演算法的Metropolis抽樣過程，冷卻過程對應控制引數的下降。這裡能量的變化就是目標函式，我們要得到的最優解就是能量最低態。其中Metropolis準則是SA演算法收斂於全域性最優解的關鍵所在，Metropolis準則以一定的概率接受惡化解，這樣就使演算法跳離區域性最優的陷阱。
SA演算法的Metropolis準則允許接受一定的惡化解，具體來講，是以一定概率來接受非最優解。舉個例子，相當於保留一些“潛力股”，使解空間裡有更多的可能性。對比輪盤賭法，從概率論來講，它是對非最優解給予概率0，即全部拋棄。
模擬退火本身是求一個最小值問題，但可以轉化為求最大值問題，只需要對目標函式加個負號或者取倒數。

演算法步驟

初始化:取初始溫度T0足夠大，令T = T0，任取初始解S1。
對比GA、ACA、PSO之類的群優化演算法，需要在解空間中產生多個個體，再繼續尋優。而SA演算法只需要一個點即可。
對當前溫度T，重複第(3)~(6)步。
對當前解S1隨機擾動產生一個新解S2。
此處隨機的擾動沒有定義。結合實際例子做選擇。
計算S2的增量df = f(S2) - f(S1)，其中f(S1)為S1的代價函式。
代價函式相當於之前群優化演算法中講的適應度函式。
若df < 0，則接受S2作為新的當前解，即S1 = S2；否則，計算S2的接受概率exp(-df/T)， T是溫度。隨機產生(0,1)區間上均勻分佈的隨機數rand，若exp(-df/T) > rand，也接受S2作為新的當前解S1 = S2，否則保留當前解S1。

這是SA演算法的核心部分，即有一定概率接受非最優解。
如果滿足終止條件Stop，則輸出當前解S1為最優解，結束程式，終止條件Stop通常取為在連續若干個Metropolis鏈中新解S2都沒有被接受時終止演算法或者是設定結束溫度。否則按衰減函式衰減T後返回第(2)步，即被接受的新的解一直在產生，則我們要對問題進行降溫，使得非最優解被接受的可能不斷降低，結果愈發收斂於最優解。

演算法特點

• 與遺傳演算法、粒子群優化演算法和蟻群演算法等不同，模擬退火演算法不屬於群優化演算法，不需要初始化種群操作。

• 收斂速度較慢。因為1）它初始溫度一般設定得很高，而終止溫度設定得低，這樣才符合物體規律，認為物質處於最低能量平衡點；2）它接受惡化解，並不是全程都在收斂的過程中。這一點可以類比GA中的變異，使得它不是持續在收斂的，所以耗時更多一些。

• 溫度管理（起始、終止溫度）、退火速度（衰減函式）等對尋優結果均有影響。比如T的衰減速度如果太快，就會導致可能尋找不到全域性最優解。

模擬退火演算法MATLAB實現

MATLAB自帶模擬退火演算法工具箱。在本文中，我們採用自帶工具箱來解決函式優化的問題，再使用自己編寫的程式來解決一個TSP問題。

要使用自帶的工具箱，我們先安裝：

【例1】一元/多元函式優化

我們要找：

一元函式：x = [1,2]範圍內 y = sin(10*pi*x) / x 的極值

二元函式：在x,y都是[-5,5]範圍內找z = x.^2 + y.^2 - 10*cos(2*pi*x) - 10*cos(2*pi*y) + 20 的極值

上面是我們提前獲得的ground-truth（用main.m，程式碼在下文）。下面我們假裝不知道這個結果的，用模擬退火方法來搜尋：

首先定義我們在SA演算法中需要用到的代價函式fitness.m：

function fitnessVal = fitness( x )

%一元函式優化：

fitnessVal = sin(10*pi*x) / x;  %求最小值

% fitnessVal = -1 * sin(10*pi*x) / x; 用模擬退火求最大值，可以加個負號或者弄個倒數！

%二元函式優化：

% fitnessVal = -1 * (x(1)^2 + x(2).^2 - 10*cos(2*pi*x(1)) - 10*cos(2*pi*x(2)) + 20);

end

主程式main.m，用於我們直觀看圖先獲得ground-truth：

%% I. 清空環境變數
clear all
clc

%% II. 一元函式優化
x = 1:0.01:2;
y = sin(10*pi*x) ./ x;
figure
plot(x,y,'linewidth',1.5)
ylim([-1.5, 1.5])
xlabel('x')
ylabel('y')
title('y = sin(10*pi*x) / x')
hold on

%%
% 1. 標記出最大值點
[maxVal,maxIndex] = max(y);
plot(x(maxIndex), maxVal, 'r*','linewidth',2)
text(x(maxIndex), maxVal, {['    X: ' num2str(x(maxIndex))];['    Y: ' num2str(maxVal)]})
hold on

%%
% 2. 標記出最小值點
[minVal,minIndex] = min(y);
plot(x(minIndex), minVal, 'ks','linewidth',2)
text(x(minIndex), minVal, {['    X: ' num2str(x(minIndex))];['    Y: ' num2str(minVal)]})

%% III. 二元函式優化
[x,y] = meshgrid(-5:0.1:5,-5:0.1:5);
z = x.^2 + y.^2 - 10*cos(2*pi*x) - 10*cos(2*pi*y) + 20;
figure
mesh(x,y,z)
hold on
xlabel('x')
ylabel('y')
zlabel('z')
title('z =  x^2 + y^2 - 10*cos(2*pi*x) - 10*cos(2*pi*y) + 20')

%%
% 1. 標記出最大值點
maxVal = max(z(:));
[maxIndexX,maxIndexY] = find(z == maxVal);
for i = 1:length(maxIndexX)
    plot3(x(maxIndexX(i),maxIndexY(i)),y(maxIndexX(i),maxIndexY(i)), maxVal, 'r*','linewidth',2)
     text(x(maxIndexX(i),maxIndexY(i)),y(maxIndexX(i),maxIndexY(i)), maxVal, {['    X: ' num2str(x(maxIndexX(i),maxIndexY(i)))];['    Y: ' num2str(y(maxIndexX(i),maxIndexY(i)))];['    Z: ' num2str(maxVal)]})
    hold on
end

現在正式開始模擬退火演算法環節。在MATLAB命令中輸入：optimtool，開啟工具箱。

boltzmann就是對應Metropolis準則的退火方式。

選擇視覺化的輸出的專案：

對於二元函式，在工具箱中的設定方法大同小異：記得先在fitness.m中修改我們的目標函式！

執行後即可得到結果。

【例2】TSP問題

這裡和上一篇講蟻群演算法的博文不同，我們的TSP中城市是自己虛擬的14座城市。

main.m:

 %% I. 清空環境變數
clear all
clc

%% II. 匯入城市位置資料
X = [16.4700   96.1000
     16.4700   94.4400
     20.0900   92.5400
     22.3900   93.3700
     25.2300   97.2400
     22.0000   96.0500
     20.4700   97.0200
     17.2000   96.2900
     16.3000   97.3800
     14.0500   98.1200
     16.5300   97.3800
     21.5200   95.5900
     19.4100   97.1300
     20.0900   92.5500];

%% III. 計算距離矩陣
D = Distance(X);  %計算距離矩陣
N = size(D,1);    %城市的個數

%% IV. 初始化引數
T0 = 1e10;   % 初始溫度，10的10次方！需要設定一個很大的溫度。
Tend = 1e-30;  % 終止溫度
L = 2;    % 各溫度下的迭代次數
q = 0.9;    %降溫速率
Time = ceil(double(solve([num2str(T0) '*(0.9)^x = ',num2str(Tend)])));  % 計算迭代的次數
% Time = 132;
count = 0;        %迭代計數
Obj = zeros(Time,1);         %目標值矩陣初始化
track = zeros(Time,N);       %每代的最優路線矩陣初始化

%% V. 隨機產生一個初始路線
S1 = randperm(N);
DrawPath(S1,X)
disp('初始種群中的一個隨機值:')
OutputPath(S1);
Rlength = PathLength(D,S1);
disp(['總距離：',num2str(Rlength)]);

%% VI. 迭代優化
while T0 > Tend
    count = count + 1;     %更新迭代次數
    temp = zeros(L,N+1);
    %%
    % 1. 產生新解
    S2 = NewAnswer(S1);
    %%
    % 2. Metropolis法則判斷是否接受新解
    [S1,R] = Metropolis(S1,S2,D,T0);  %Metropolis 抽樣演算法
    %%
    % 3. 記錄每次迭代過程的最優路線
    if count == 1 || R < Obj(count-1)
        Obj(count) = R;           %如果當前溫度下最優路程小於上一路程則記錄當前路程
    else
        Obj(count) = Obj(count-1);%如果當前溫度下最優路程大於上一路程則記錄上一路程
    end
    track(count,:) = S1;
    T0 = q * T0;     %降溫
end

%% VII. 優化過程迭代圖
figure
plot(1:count,Obj)
xlabel('迭代次數')
ylabel('距離')
title('優化過程')

%% VIII. 繪製最優路徑圖
DrawPath(track(end,:),X)

%% IX. 輸出最優解的路線和總距離
disp('最優解:')
S = track(end,:);
p = OutputPath(S);
disp(['總距離：',num2str(PathLength(D,S))]);

計算距離的函式Distance.m：

function D = Distance(citys)
%% 計算兩兩城市之間的距離
% 輸入 citys  各城市的位置座標
% 輸出 D  兩兩城市之間的距離

n = size(citys,1);
D = zeros(n,n);
for i = 1:n
    for j = i+1:n
        D(i,j) = sqrt(sum((citys(i,:) - citys(j,:)).^2));
        D(j,i) = D(i,j);
    end
end

畫出路徑的函式DrawPath.m：

function DrawPath(Route,citys)
%% 畫路徑函式
%輸入
% Route  待畫路徑   
% citys  各城市座標位置

figure
plot([citys(Route,1);citys(Route(1),1)],...
     [citys(Route,2);citys(Route(1),2)],'o-');
grid on

for i = 1:size(citys,1)
    text(citys(i,1),citys(i,2),['   ' num2str(i)]);
end

text(citys(Route(1),1),citys(Route(1),2),'       起點');
text(citys(Route(end),1),citys(Route(end),2),'       終點');

輸出路徑函式OutputPath.m：

function p = OutputPath(R)
%% 輸出路徑函式
% 輸入：R 路徑
R = [R,R(1)];
N = length(R);
p = num2str(R(1));
for i = 2:N
    p = [p,'―>',num2str(R(i))];
end
disp(p)

增加隨機擾動產生新解NewAnswer.m：

function S2 = NewAnswer(S1)
%% 輸入
% S1:當前解
%% 輸出
% S2：新解

N = length(S1);
S2 = S1;                
a = round(rand(1,2)*(N-1)+1); %產生兩個隨機位置 用來交換
W = S2(a(1));
S2(a(1)) = S2(a(2));
S2(a(2)) = W;         %得到一個新路線

我們的做法是隨機產生兩個城市讓他們交換位置，從而得到一個新的路徑。當然，這只是這個問題的一個做法，也有其他“增加隨機擾動”的做法，而且對於多元函式問題更加簡單，只要在當前解的附近增加一些小的值即可。

Metropolis準則的實現：

function [S,R] = Metropolis(S1,S2,D,T)
%% 輸入
% S1：  當前解
% S2:   新解
% D:    距離矩陣（兩兩城市的之間的距離）
% T:    當前溫度
%% 輸出
% S：   下一個當前解
% R：   下一個當前解的路線距離

R1 = PathLength(D,S1);  %計算路線長度
N = length(S1);         %得到城市的個數

R2 = PathLength(D,S2);  %計算路線長度
dC = R2 - R1;   %計算能力之差
if dC < 0       %如果能力降低 接受新路線
    S = S2;
    R = R2;
elseif exp(-dC/T) >= rand   %以exp(-dC/T)概率接受新路線
    S = S2;
    R = R2;
else        %不接受新路線
    S = S1;
    R = R1;
end

程式結果：

模擬退火(Simulated Annealing, SA)演算法簡介與MATLAB實現

目錄演算法步驟演算法特點模擬退火演算法概述模擬退火演算法(Simulated Annealing，簡稱SA)的思想最早是由Metropolis等提出的。其出發點是基於物理中固體物質的退火過程與一般的組合優化問題之間的相似性。模擬退火法是一種

決策樹演算法簡介及其MATLAB實現程式碼

目錄決策樹原理概述決策樹通過把樣本例項從根節點排列到某個葉子節點來對其進行分類。樹上的每個非葉子節點代表對一個屬性取值的測試，其分支就代表測試的每個結果（yes no表示正類、負類）;而樹上的每個葉子節點均代表一個分類的類別，樹的最高層節點是

人工蜂群演算法簡介與程式分析

目前人工蜂群演算法主要分為基於婚配行為與基於釆蜜行為兩大類，本文研究的是基於釆蜜行為的人工蜂群演算法。蜜蜂採蜜自然界中的蜜蜂總能在任何環境下以極高的效率找到優質蜜源，且能適應環境的改變。蜜蜂群的採蜜系統由蜜源、僱傭蜂、非僱傭蜂三部分組成，其中一個蜜源的優劣有很多要素，如蜜源花蜜

樸素貝葉斯演算法優化與 sklearn 實現

1. 引言上一篇日誌中，我們主要介紹了貝葉斯演算法，並提供了 python 實踐：樸素貝葉斯演算法的推導與實踐但執行上一篇日誌中的示例，我們發現出現了下面的結果： ['love', 'my', 'dalmation'] 屬於非侮辱類 ['stu

名人問題演算法解析與Python 實現 O(n) 複雜度（以Leetcode 277. Find the Celebrity為例）

1. 題目描述 Problem Description Leetcode 277. Find the Celebrity Suppose you are at a party with n people (labeled from 0 to n -

Factorization Machines簡介與程式碼實現

介紹 FM是聯合SVM與因式分解模型的優點所得。在有比較大的資料稀疏情況下，也能從中找出聯絡。FM可以線上性時間內優化。優點可以在非常稀疏的資料中進行合理的引數估計 FM模型的時間複雜度是線性的 FM是一個通用模型，它可以用於任何特徵為實值的

粒子群優化演算法（PSO）簡介及MATLAB實現

目錄粒子群優化演算法概述 • 粒子群優化(PSO, particle swarm optimization)演算法是計算智慧領域，除了蟻群演算法，魚群演算法之外的一種群體智慧的優化演算法，該演算法最早由Kennedy和Eberhart在1995年提出的，

《機器學習實戰》AdaBoost方法的演算法原理與程式實現

一、引言提升(boosting)方法是一種常用的統計學習方法，應用廣泛且有效，在分類問題中，它通過改變訓練樣本的權重，學習多個分類器，並將這些分類器進行線性組合，提高分類的效能。對於分類問題，給定一個訓練樣本集，比較粗糙的分類規則（弱分類器），要比精確分類規則（強分類器）容易

高斯混合模型視訊背景建模的EM演算法與Matlab 實現

1.問題描述影像的背景前景分離. 輸⼊為影像監控的1000 幀 (如下⽅圖中左邊所⽰), 要求輸出是背景和前景 (如下⽅圖中右邊所⽰). 2.背景知識觀察待處理的監控影像，可以發現，前景主要是來來往往的行人，背景始終是攝像頭對準的固定區域，

決策樹演算法原理與 Python實現

轉自： https://blog.csdn.net/huahuazhu/article/details/73167610?locationNum=2&fps=1 ###########################################

協同過濾演算法概述與python 實現協同過濾演算法基於內容（usr-item,item-item）

協調過濾推薦概述　協同過濾(Collaborative Filtering)作為推薦演算法中最經典的型別，包括線上的協同和離線的過濾兩部分。所謂線上協同，就是通過線上資料找到使用者可能喜歡的物品，而離線過濾，則是過濾掉一些不值得推薦的資料，比比如推薦值

A*演算法與matlab實現

A*演算法是一種尋路演算法，常常被用在遊戲智慧ai的自動尋路過程等等，它較之於圖論的最短路演算法而言，更加適用於節點巨大的情況下，但是該演算法是一種啟發式搜尋演算法，並不能保證總是找到最優路徑。 A*的演算法思想如下：定義兩個函式：f和g，其中f揭示當前點到出發點的距離

資料探勘十大演算法（五）：EM(Expectation Maximum)演算法原理與Python實現

參考：一、一個簡單的概率問題實驗：現在有A和B兩個硬幣，我們從這兩個硬幣中，隨機選取5次，做5組實驗，每組實驗內容是：丟擲所選的硬幣，記錄正反面。實驗資料如下：目標：根據所得到的實驗資料，分別求出硬幣A和B丟擲後正面向上的概率。根據古典概率的原

leveldb簡介與java實現demo

簡介 1.簡介 Leveldb是一個google實現的非常高效的kv資料庫，目前的版本1.2能夠支援billion級別的資料量了。在這個數量級別下還有著非常高的效能，主要歸功於它的良好的設計。特別是LSM演算法。 2特點 LevelDB 是單程序的服務，效能非常之高

時間複雜度為O(N*logN)的常用排序演算法總結與Java實現

時間複雜度為O(N*logN)的常用排序演算法主要有四個——快速排序、歸併排序、堆排序、希爾排序1.快速排序·基本思想隨機的在待排序陣列arr中選取一個元素作為標記記為arr[index](有時也直接選擇起始位置)，然後在arr中從後至前以下標j尋找比arr[inde

MD5簡介與程式碼實現

MD5簡介 md5的全稱是message-digest algorithm 5（資訊-摘要演算法），在90年代初由mit laboratory for computer science和rsa data security inc的ronald l. rivest開

DeepFM: A Factorization-Machine based Neural Network for CTR Prediction簡介與程式碼實現

論文簡介 Abstract 對於一個基於CTR預估的推薦系統，最重要的是學習到使用者點選行為背後隱含的特徵組合。在不同的推薦場景中，低階組合特徵或者高階組合特徵可能都會對最終的CTR產生影響。但是現存的方法總是忽視了高階或低階組合特徵的聯絡，或者要求專門的特徵工程，因此作者建立了

Field-aware Factorization Machines for CTR Prediction簡介與程式碼實現

摘要 FM被廣泛應用在CTR，但是FFM在一些世界範圍的CTR競賽表現好於目前存在的模型。作者實現了相關程式碼，並與一些競爭模型進行了全面的分析。實驗證明FFM在某些分類問題上非常有用。介紹 FFM 對於這個例子來說，FM的隱向量表示應該為：在FM中，每個

蟻群演算法簡介及matlab原始碼

1 蟻群演算法原理自1991年由義大利學者 M. Dorigo，V. Maniezzo 和 A. Colorni 通過模擬蟻群覓食行為提出了一種基於種群的模擬進化演算法——蟻群優化。該演算法的出現引起了學者們的極大關注，蟻群演算法的特點： ① 其原理是一種正

八大排序演算法總結與Java實現

概述因為健忘，加上對各種排序演算法理解不深刻，過段時間面對排序就蒙了。所以決定對我們常見的這幾種排序演算法進行統一總結，強行學習。首先羅列一下常見的十大排序演算法：直接插入排序希爾排序簡單選擇排序堆排序氣泡排

模擬退火(Simulated Annealing, SA)演算法簡介與MATLAB實現

模擬退火演算法概述

演算法步驟

演算法特點

模擬退火演算法MATLAB實現

【例1】一元/多元函式優化

【例2】TSP問題

相關推薦