「筆記」模擬退火

阿新 • • 發佈：2021-06-13

寫在前面
正文
例題

寫在前面

感謝 caq 的傾情講解

模擬退火是個隨機化演算法，正確性有一定保證，但如果你想我一樣臉黑的話......

~~實測模擬退火做多了 rp 會掉~~

正文

簡介

模擬退火是一種隨機化演算法，當一個問題的方案數量極大（甚至是無窮的）而且不是一個單峰函式時，我們常使用模擬退火求解。- Oi-wiki

什麼是退火？

退火是一種金屬熱處理工藝，指的是將金屬緩慢加熱到一定溫度，保持足夠時間，然後以適宜速度冷卻。目的是降低硬度，改善切削加工性；消除殘餘應力，穩定尺寸，減少變形與裂紋傾向；細化晶粒，調整組織，消除組織缺陷。準確的說，退火是一種對材料的熱處理工藝，包括金屬材料、非金屬材料。而且新材料的退火目的也與傳統金屬退火存在異同。---百度百科

扯遠了。

這個演算法就是在溫度不斷降低的過程中，不斷地從當前位置尋找別的位置進行計算，溫度越低，也就是它的動能越小時，位置就會變化的越小，最後逐漸停留在最優解（或者附近）

演算法流程

每次隨機一個新的狀態，如果狀態更優就更新答案，否則以一定概率接受這個狀態。

Metropolis準則

以求最小值為例。

如果 \(\Delta E < 0\)，說明當前解更優，直接更新即可
否則，如果

\[e^{\frac{-\Delta E}{T}} > \frac{\text{rand()}}{\text{RAND_MAX}} \]

就接受這個狀態。

否則直接跳過。

為什麼？
第一步因為是最優解所以一定選擇更新答案
第二步後邊的是一個隨機值我們暫且不論。
考慮整個退火過程，
假設溫度 \(T\)

不變，新的解越劣，\(\Delta E\) 越大，左項的值越小，接受的概率也越小。
假設 \(\Delta E\) 不變，隨著溫度的下降，求解的範圍也趨於穩定，\(T\) 越小，左項得值也越小，接受的概率也越小

扔一張圖可能會更好理解：

聽上去很扯，但它還是有一定的正確性的。

SA 函式

通常降溫係數 \(d\) 是一個很接近 \(1\) 的數，終止溫度 \(T_0\) 是一個很接近 \(0\) 的數

這裡給一個虛擬碼：

const double lim = ... // 溫度最小值，通常為 1e-10 左右
const double d = ... // 變化係數，通常為 0.996 左右
void SA() {
    double T = ... // 初始溫度，通常為 2021 左右
    while(T > lim) {
        ... // 獲取一個隨機的位置
        now = calc(); // 計算當前位置的答案 
        del = now - ans; // 計算 變化量
        if(del < 0) { // 以最小值為例
            ans = now; // 更新答案
            ...  // 更新答案和中間量的狀態
        } else if(exp(-del/T) > (double)rand()/RAND_MAX) {
            ...  // 一定概率選擇當前當前狀態
        } 
        T *= d; // 降溫
    }
}

計算函式 calc

依據題目而定，這裡不給出

一些技巧

如果想要隨機一個無限大平面內的一個點，可以這樣：

double nowx = limx + ((rand() << 1) - RAND_MAX) * T;
double nowy = limy + ((rand() << 1) - RAND_MAX) * T;

其中 nowx,nowy 是我們隨機的位置， limx, limy 是我們一箇中間狀態的位置（注意不是答案的位置），
後面的那一坨剛好對應著溫度越小變化越小的實際情況。

我們有時為了使得到的解更有質量，會在模擬退火結束後，以當前溫度在得到的解附近多次隨機狀態，嘗試得到更優的解（其過程與模擬退火相似）。

模擬退火是個隨機的演算法，執行次數越多獲得的解越有可能更優，所以我們可以執行多遍 SA 函式。至於如何控制時間？

while((double)clock()/CLOCKS_PER_SEC < 0.90) SA();

上面這個程式碼控制時間在 \(0.90s\) 左右，如果時間限制為 \(1s\)，而每次 SA 函式執行時間略長時，就要小心可能會 \(\text{T}\) 掉了。

如果一個程式碼不行，就考慮換個種子吧。

srand(...);

為了獲得更精確的解，也可以把 \(d\) 和 \(T_0\) 調的更精準一點

const double d = 0.996 -> 0.99996;
const double lim = 1e-10 -> 1e-15;

還有，隨機亂搞一些初溫，終溫，降溫係數也是可以的。

例題

咕咕咕。。。

「筆記」模擬退火

目錄寫在前面正文簡介什麼是退火？演算法流程Metropolis準則SA 函式計算函式 calc一些技巧例題

「筆記」網路流 flows 小記

基本沒有嚴謹證明。 Part. 1 概念 Part. 1-1 流網路流網路是一個有向圖（不考慮反向邊），我們把這個圖記為 \\(G=(V,E)\\)。

「筆記」字尾陣列

寫在前面網上部分題解直接對著優化後面目全非的程式碼開講。 *這太野蠻了*

「筆記」AC 自動機

寫在前面這篇文章的主體是在沒網的悲慘狀況下完成的。前置知識：Trie 樹，DFA，KMP 字串匹配演算法。

「筆記」數位DP

目錄寫在前面引入求解特判優化程式碼例題「ZJOI2010」數字計數「AHOI2009」同類分佈套路題們「SDOI2014」數數寫在最後

「筆記」虛樹

寫在前面以前寫的太簡略了，重新來總結一下。如果您是初學者建議配合閱讀虛樹 - OI Wiki 上的圖示閱讀。

「筆記」2-SAT

寫在前面草草草疫情期間我都在家水了些啥啊啊啊啊= = 蠻有意思的建模技巧，對圖論有了新的認識。

「筆記」左偏樹

目錄寫在前面正文一些定義基本性質幾個結論核心操作-合併操作基操-插入一個新的結點基操-找一個結點的根節點基操-求最小值基操-刪除一個最小值Code例題P3377 【模板】左偏樹（可並堆）P2713 羅馬遊戲P1456 Monkey Ki

「筆記」線性基

概念線性基是向量空間的一組基，通常可以解決有關異或的一些題目。-Oi-wiki

「筆記」不僅僅是並查集

就算只有六十億分之一的機會，我們還是會邂逅。目錄寫在前面普通並查集初始化尋找根節點合併查詢路徑壓縮帶權並查集種類並查集

「筆記」FHQ-Treap

目錄一、簡介二、核心操作1. 分裂2. 合併三、其他操作1. 基本操作2. 插入操作3. 刪除操作4. 查詢排名5. 第 k 小數6. 查詢前驅/後繼四、模板五、區間操作

「筆記」數論做題記錄

人沒有回憶是無法活下去的喲目錄BSGS尤拉定理P2155 [SDOI2008] 沙拉公主的困惑P4139 上帝與集合的正確用法CF906D Power TowerP3934 [Ynoi2016] 炸脖龍 IP3747 [六省聯考 2017] 相逢是問候擴充套件中國剩餘定理P

「筆記」Systemd 的基礎

常用命令 systemctl 啟動服務: systemctl start service 停止服務: systemctl stop service 重啟服務: systemctl restart service

「Go學習筆記」1.初識Go

前言由於在公司廣泛使用Docker的大環境下，突然對它的程式語言（Go）瞭解下。並且感覺現在Go語言的應用也是越來越廣泛，很多網際網路大廠都在使用，目前利用業餘時間來學習下，主流還是Java，學明白以後可能考慮轉哦

「Wallace 筆記」序列自動機入門

基本概念記號同為 DFA 的記號。 \\(\\Sigma\\)：字符集； \\(Q\\)：狀態集； \\(q_0(\\in Q)\\)：起始狀態；

「演算法筆記」數位DP

一、關於數位 dp 有時候我們會遇到某類問題，它所統計的物件具有某些性質，答案在限制/貢獻上與統計物件的數位之間有著密切的關係，有可能是數位之間聯絡的形式，也有可能是數位之間相互獨立的形式。（如求滿足條件的

「刷題筆記」AC自動機

Keywords Research 板子題，同luoguP3808，不過是多測。然後多測不清空，\\(MLE\\)兩行淚。

「演算法筆記」狀壓DP

一、關於狀壓 dp 為了規避不確定性，我們將需要列舉的東西放入狀態。當不確定性太多的時候，我們就需要將它們壓進較少的維數內。

「學習筆記」二項式反演

Description link 在兩個集合中選數字，求選出來的方案中 \\(A\\) 恰好比 \\(B\\) 多 \\(k\\) 個的方案數

「Wallace 筆記」快速上手迴文自動機（PAM）

Content 簡述概念結構構建實現正確性後記簡述迴文樹（EER Tree）是可以儲存一個字串的所有迴文字串的一種實用資料結構。

「筆記」模擬退火

寫在前面

正文

簡介

什麼是退火？

演算法流程

Metropolis準則

SA 函式

計算函式 calc

一些技巧

例題

相關推薦