【算法】禁忌搜索算法(Tabu Search,TS)超詳細通俗解析附C++代碼實例
1.1 先從爬山算法說起
爬山算法從當前的節點開始,和周圍的鄰居節點的值進行比較。 如果當前節點是最大的,那麽返回當前節點,作為最大值 (既山峰最高點);反之就用最高的鄰居節點來,替換當前節點,從而實現向山峰的高處攀爬的目的。如此循環直到達到最高點。因為不是全面搜索,所以結果可能不是最佳。
1.2 再到局部搜索算法
局部搜索算法是從爬山法改進而來的。局部搜索算法的基本思想:在搜索過程中,始終選擇當前點的鄰居中與離目標最近者的方向搜索。同樣,局部搜索得到的解不一定是最優解。
1.3 然後到禁忌搜索算法
為了找到“全局最優解”,就不應該執著於某一個特定的區域。於是人們對局部搜索進行了改進,得出了禁忌搜索算法。
禁忌(Tabu Search)算法是一種亞啟發式(meta-heuristic)隨機搜索算法,它從一個初始可行解出發,選擇一系列的特定搜索方向(移動)作為試探,選擇實現讓特定的目標函數值變化最多的移動。為了避免陷入局部最優解,TS搜索中采用了一種靈活的“記憶”技術,對已經進行的優化過程進行記錄和選擇,指導下一步的搜索方向,這就是Tabu表的建立。
1.4 最後打個比方
為了找出地球上最高的山,一群有誌氣的兔子們開始想辦法。
1) 爬山算法
兔子朝著比現在高的地方跳去。他們找到了不遠處的最高山峰。但是這座山不一定是珠穆朗瑪峰。這就是爬山法,它不能保證局部最優值就是全局最優值。
2) 禁忌搜索算法
02 思想和過程
2.1 基本思想
標記已經解得的局部最優解或求解過程,並在進一步的叠代中避開這些局部最優解或求解過程。局部搜索的缺點在於,太過於對某一局部區域以及其鄰域的搜索,導致一葉障目。為了找到全局最優解,禁忌搜索就是對於找到的一部分局部最優解,有意識地避開它,從而或得更多的搜索區域。
比喻:兔子們找到了泰山,它們之中的一只就會留守在這裏,其他的再去別的地方尋找。就這樣,一大圈後,把找到的幾個山峰一比較,珠穆朗瑪峰脫穎而出。
2.2 算法過程
step1:給以禁忌表H=空集,並選定一個初始解xnow;
step2:滿足停止規則時,停止計算,輸出結果;否則,在xnow的鄰域N(xnow)中選擇不受禁忌的候選集Can_N(xnow);在Can_N(xnow)中選一個評價值最佳的解xnext,xnow=xnext;更新歷史記錄H,保存f(xnow),重復step2;
step3:在保存的眾多f中,挑選最小(大)值作為解;
03 相關概念解釋
又到了科普時間了。其實,關於鄰域的概念前面的好多博文都介紹過了。今天還是給大家介紹一下。這些概念對理解整個算法的意義很大,希望大家好好理解。
1) 鄰域
官方一點:所謂鄰域,簡單的說即是給定點附近其他點的集合。在距離空間中,鄰域一般被定義為以給定點為圓心的一個圓;而在組合優化問題中,鄰域一般定義為由給定轉化規則對給定的問題域上每結點進行轉化所得到的問題域上結點的集合。
通俗一點:鄰域就是指對當前解進行一個操作(這個操作可以稱之為鄰域動作)可以得到的所有解的集合。那麽鄰域的本質區別就在於鄰域動作的不同了。
2) 鄰域動作
鄰域動作是一個函數,通過這個函數,對當前解s,產生其相應的鄰居解集合。例如:對於一個bool型問題,其當前解為:s = 1001,當將鄰域動作定義為翻轉其中一個bit時,得到的鄰居解的集合N(s)={0001,1101,1011,1000},其中N(s) ∈ S。同理,當將鄰域動作定義為互換相鄰bit時,得到的鄰居解的集合N(s)={0101,1001,1010}。
3) 禁忌表
包括禁忌對象和禁忌長度。(當兔子們再尋找的時候,一般地會有意識地避開泰山,因為他們知道,這裏已經找過,並且有一只兔子在那裏看著了。這就是禁忌搜索中“禁忌表(tabu list)”的含義。)
4) 侯選集合
侯選集合由鄰域中的鄰居組成。常規的方法是從鄰域中選擇若幹個目標值或評價值最佳的鄰居入選。
5) 禁忌對象
禁忌算法中,由於我們要避免一些操作的重復進行,就要將一些元素放到禁忌表中以禁止對這些元素進行操作,這些元素就是我們指的禁忌對象。(當兔子們再尋找的時候,一般地會有意識地避開泰山,因為這裏找過了。並且還有一只兔子在這留守。)
6) 禁忌長度
禁忌長度是被禁對象不允許選取的叠代次數。一般是給被禁對象x一個數(禁忌長度) t ,要求對象x 在t 步叠代內被禁,在禁忌表中采用tabu(x)=t記憶,每叠代一步,該項指標做運算tabu(x)=t?1,直到tabu(x)=0時解禁。於是,我們可將所有元素分成兩類,被禁元素和自由元素。禁忌長度t 的選取可以有多種方法,例如t=常數,或t=[√n],其中n為鄰域中鄰居的個數;這種規則容易在算法中實現。
(那只留在泰山的兔子一般不會就安家在那裏了,它會在一定時間後重新回到找最高峰的大軍,因為這個時候已經有了許多新的消息,泰山畢竟也有一個不錯的高度,需要重新考慮,這個歸隊時間,在禁忌搜索裏面叫做“禁忌長度(tabu length)”。)
7) 評價函數
評價函數是侯選集合元素選取的一個評價公式,侯選集合的元素通過評價函數值來選取。以目標函數作為評價函數是比較容易理解的。目標值是一個非常直觀的指標,但有時為了方便或易於計算,會采用其他函數來取代目標函數。
8) 特赦規則
在禁忌搜索算法的叠代過程中,會出現侯選集中的全部對象都被禁忌,或有一對象被禁,但若解禁則其目標值將有非常大的下降情況。在這樣的情況下,為了達到全局最優,我們會讓一些禁忌對象重新可選。這種方法稱為特赦,相應的規則稱為特赦規則。
(如果在搜索的過程中,留守泰山的兔子還沒有歸隊,但是找到的地方全是華北平原等比較低的地方,兔子們就不得不再次考慮選中泰山,也就是說,當一個有兔子留守的地方優越性太突出,超過了“best so far”的狀態,就可以不顧及有沒有兔子留守,都把這個地方考慮進來,這就叫“特赦準則(aspiration criterion)”。)
04 代碼實例(代碼來源網絡)
這次還是用一個求解TSP的代碼實例來給大家講解吧。
數據文件下載戳這裏:
http://www.iwr.uni-heidelberg.de/groups/comopt/software/TSPLIB95/tsp/
下載下來跟代碼放一個路徑裏直接就可以跑,記得把下面那個存路徑的string改成你自己的。輸入是0~9代表10個不同的tsp文件。
欲獲取代碼,請關註我們的微信公眾號【程序猿聲】,在後臺回復:TS代碼。即可獲取。
【算法】禁忌搜索算法(Tabu Search,TS)超詳細通俗解析附C++代碼實例