1. 程式人生 > 其它 >A*演算法解N數碼問題

A*演算法解N數碼問題

技術標籤:筆記遞迴演算法機器學習資料結構啟發式推理python

文章目錄


前言

最近上課遇到了八數碼問題,正好為了練一練程式碼,就自己動手開始寫,因為用的python,沒有傳統的樹和連結串列結構,所以寫起來遇到了一些麻煩,這裡記錄一下,大佬輕拍


一、A*演算法

A*演算法是一種啟發式演算法,具體內容可參考一下這位大佬的筆記,記錄的很詳細,我的演算法也是基於這篇筆記復現的。這篇文章也解釋了A和A*演算法的重要區別,解答了我對於這兩個演算法的疑問。
https://blog.csdn.net/qwezhaohaihong/article/details/103353885

二、N數碼問題

八數碼問題是N數碼的特殊情況,對於python的N數碼實現參考了這篇文章。
https://blog.csdn.net/qq_35976351/article/details/82767029

這篇文章建立了一種節點狀態類,將演算法搜尋過程中的節點狀態,父子節點、啟發函式值等元素加入類中,並覆寫了類的相等判斷,使得節點類能夠模擬出搜尋樹的結構,這一點在我的程式碼中有所借鑑。

原文章賦予OPEN表堆特性,並且覆寫比較函式,用啟發值進行比較,使得在OPEN表的維護在堆的壓入和彈出過程自動完成。為堆排序覆寫的比較函式也是啟發我的一點。

但是這篇文章中程式碼有一些錯誤,比如在計算manhattan距離時目標碼盤對應元素的位置解算有錯誤。另外在求解過程中引入了hash值去重,但還是會有重複判斷的問題。對於OPEN表、CLOSE表、M表和G樹的維護也有所欠缺。

三、程式碼實現

1.碼盤節點的類定義

程式碼如下:

class Astar_node(object):
    def __init__(self, gn, hn, state=None, par=None):
        '''
        初始化
        :param state: 節點儲存的狀態
        :param par: 父節點
        '''
        self.state = state  # 節點狀態
        self.par = par  # 父節點
        self.gn, self.hn = gn, hn  # 啟發資訊

    @property  # 定義fn屬性
    def fn
(self): return self.gn + self.hn def __eq__(self, obj): # 相等的判斷 return self.state == obj.state def __ne__(self, obj): # 不等的判斷 return not self.__eq__(obj) def print_state(self): for row in range(Lenth): for col in range(Lenth): print('%3d' % self.state[row][col], end='') print('') print('--------------------') def print_node(self): print("gn=%d,hn=%d,fn=%d" % (self.gn, self.hn, self.fn)) self.print_state()

對於碼盤節點的類定義,在實現過程中首先定義了基本啟發函式g(n)和h(n)以及節點狀態和父節點指向等基本屬性。對於啟發函式f(n)採用屬性定義方法,避免在OPEN表排序時忘記賦值的錯誤。
由於在排序過程中沒有使用堆特性,直接使用sort函式對例項的屬性進行排序,所以刪除了原來的大小比較函式的覆寫。
個人認為在A*演算法中已經充分考了節點重複狀態下的問題。擴充套件節點加入M表時已經排除了當前節點的父節點,也就是不走回頭路。M中的資料在加入OPEN、CLOSE表的過程中也進行了重複性驗證,對重複節點遇到啟發函式值更小的情況已經進行了考慮。所以我取消了用hash值對碼盤的狀態進行去重判斷和相等判斷,而是採用原始碼盤狀態進行重複性驗證和相等判斷。

另外在十五數碼問題過程中我發現一個很有意思的現象,這也是為什麼我想記錄下實現過程的原因,就是關於g(n)的設定問題。一般在A*演算法中,通常關注f(n)的選取,但很少討論g(n)的選取,一般認為每進行一部擴充套件,將g(n)加1,也就是我們認為每走一步則增加一個步數的代價。但是在我測試的過程中發現,g(n)對演算法的搜尋效率也有非常大的影響,下面是我測試g(n)每擴充套件一步深度,所花費的時間,100秒為演算法求解超時

①g(n)= 1
在這裡插入圖片描述
②g(n)= -1
在這裡插入圖片描述
③g(n)=0.2
在這裡插入圖片描述
④g(n)= 0.5
在這裡插入圖片描述

可以看到在g(n)=1的時候,搜尋演算法搜尋了大量的節點,但是實際求出的解路徑只有14個,最後超時未求解出來答案。
g(n)=0.5時得到了相似的結果,但是這次演算法搜尋了相近的節點數,雖然同樣沒有求出答案,但是走出了更多的解路徑。
g(n)=-1時,演算法很快就求出瞭解路徑,但是解路徑十分長。顯然不是A*演算法所要求解的最優路徑。
g(n)= 0.2時,演算法在一個相對合理的時間內求出了一條相對合理的解。
至此可以得出對於A*解十五數碼問題的一個大致結論:
1.首先每一步的g(n)並不是取1最好,g(n)所代表的代價並不是實際所走的步數
2.g(n)有一個合適的取值區間能夠同時取得解的優選時間和優選路徑。
3.g(n)取值超過2中的區間後求解時間和路徑會隨取值增大成指數級增長。
4.g(n)取值小於2中的區間後,求解路徑會隨取值增加而減小,但時間會在一定範圍內縮減。

那麼2中所說的區間是否存在呢。我嘗試驗證了之後得到一下資料:
⑤g(n) = 0.22
在這裡插入圖片描述

⑥g(n)= 0.25,0.27,0.29

在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述

⑦g(n) = 0.3
在這裡插入圖片描述

⑧g(n)=0.32
在這裡插入圖片描述

⑨g(n)=0.35
在這裡插入圖片描述

⑩g(n) = 0.46,0.44,0,42超時

另外有一個不符合規律的資料,在0.23~0.24之間,演算法執行時間都較長,並且0.24為幾秒,而0.238為十幾秒。這組資料較為反常。
g(n)=0.23
在這裡插入圖片描述

除去反常資料可以看到,g(n)對演算法求解影響大致是符合三條規律的。
在我完成了程式碼之後,在初始使用g(n)=1求解演算法時,無法得出原本能幾秒求出的解,我在反覆檢查了程式碼之後發現依然不能求解,但是卻能求解簡單的碼盤,因此我嘗試不使用步數代價,發現能夠很快求出解。後面才有了這些資料。在此提出我的猜想:
如果有玩過華容道或拼圖遊戲的朋友可能會知道,最短的求解路徑有時候反而需要多走一些步數,而在十五數碼這個問題中,一個空格轉一圈回到原點時,實際上碼盤是會發生改變的,而這個過程中可能會增加h(n)的值,但是在旋轉完成 後,整個f(n)的值卻可能是最小的。因此猜測這就是為什麼g(n)的最優區間在0.25附近。當小於這個區間時,我們實際上是減小解路徑的行走代價,鼓勵多在解路徑上進行嘗試,因此會出現長路徑和少擴充套件以及合適的求解時間。當大於這個區間時,我們在增加演算法在解路徑的行走代價,造成演算法每走一步都需要謹慎小心,不斷擴充套件節點,期望求得較小的行走代價從而得到最短的路徑,最終造成擴充套件圖十分龐大,超時後最終能得到的解路徑很少。
因此g(n)的選取對演算法其實是有影響的。
PS:如果有興趣可以嘗試一下h(n)函式對演算法求解的影響。

2.原始碼

程式碼如下(示例):

import copy
import re
import time
import os


# Lenth = 0  # 碼盤邊長


# 狀態節點
class Astar_node(object):
    def __init__(self, gn, hn, state=None, par=None):
        '''
        初始化
        :param state: 節點儲存的狀態
        :param par: 父節點
        '''
        self.state = state  # 節點狀態
        self.par = par  # 父節點
        self.gn, self.hn = gn, hn  # 啟發資訊

    @property  # 定義fn屬性
    def fn(self):
        return self.gn + self.hn

    def __eq__(self, obj):  # 相等的判斷
        return self.state == obj.state

    def __ne__(self, obj):  # 不等的判斷
        return not self.__eq__(obj)

    def print_state(self):
        for row in range(Lenth):
            for col in range(Lenth):
                print('%3d' % self.state[row][col], end='')
            print('')
        print('--------------------')

    def print_node(self):
        print("gn=%d,hn=%d,fn=%d" % (self.gn, self.hn, self.fn))
        self.print_state()


def manhattan_dis(cur):
    '''
    計算和目標碼盤的曼哈頓距離
    :param cur: 當前節點
    :return: 到目的狀態的曼哈頓距離
    '''
    cur_state = cur.state
    end_state = end_node.state
    dist = 0
    for row in range(Lenth):
        for col in range(Lenth):
            if cur_state[row][col] == end_state[row][col]:
                continue
            num = cur_state[row][col]
            # 求目標碼盤對應元素的橫縱座標
            num_row = num // Lenth if num % 4 != 0 else (num - 1) // Lenth
            num_row = num_row if num_row != -1 else 3
            num_col = num % Lenth - 1
            num_col = num_col if num_col != -1 else 3
            dist += (abs(row - num_row) + abs(col - num_col))
    return dist


class A_start:
    '''
    A*演算法初始化
    :param start: 起始節點
    :param end: 終止節點
    :param heuristic_fn: 啟發函式
    return: G search_cnt
    '''

    def __init__(self, start, end, heuristic_fn,time_limite):
        self.OPEN = []  # OPEN表
        self.CLOSE = []  # CLOSE表
        self.G = []  # 搜尋樹
        self.start = start
        self.end = end
        self.cur_node = None
        self.heuristic_fn = heuristic_fn
        self.start_t = 0  # 計時變數
        self.end_t = 0

        self.G.append(self.start)  # 初始化搜尋圖
        self.OPEN.append(self.start)  # 初始化OPEN表

    def begin_search(self):  # 演算法開始
        self.start_t = time.time()
        # 找空位座標
        blank_pos = None
        while 1:
            # OPEN表為空表示無解 直接退出
            if self.OPEN == [] or (time.time()-self.start_t>time_limite):
                print("There is no anser!")
                self.print_result()
                break
            else:
                self.cur_node = self.OPEN.pop(0)  # 彈出OPEN表中第一個元素
                self.CLOSE.append(self.cur_node)  # 當前節點放入CLOSE表表示擴充套件完成
                # self.cur_node.print_node()
                # 搜尋到目標節點
                if self.cur_node == self.end:
                    # self.end.par=self.cur_node
                    print("Success!")
                    self.print_result()
                    break
                # 找節點空位
                for row in range(Lenth):
                    for col in range(Lenth):
                        if self.cur_node.state[row][col] == 0:
                            blank_pos = [row, col]
                            break
                # 擴充套件節點
                M = []  # 擴展出的新節點集合(不包括當前節點的父節點)
                for dict in dicts:
                    b_x, b_y = blank_pos[0], blank_pos[1]
                    n_x, n_y = b_x + dict[0], b_y + dict[1]
                    if n_x in range(Lenth) and n_y in range(Lenth):  # 越界判定
                        new_node = Astar_node(0, 0, copy.deepcopy(self.cur_node.state))
                        new_node.state[b_x][b_y], new_node.state[n_x][n_y] = \
                            new_node.state[n_x][n_y], new_node.state[b_x][b_y]  # 移動空位
                        if new_node != self.cur_node.par:  # 擴充套件結點不是當前節點的父節點
                            new_node.gn = self.cur_node.gn + 0.25
                            new_node.hn = self.heuristic_fn(new_node)  # 計算節點hn
                            M.append(new_node)  # 新節點加入集合
                # 處理新擴充套件的節點
                for node in M:
                    # 去重擴充套件搜尋樹
                    if node not in self.G:
                        self.G.append(node)
                    # 未出現在OPEN和CLOSE表中 將擴充套件節點父節點設為當前節點並加入OPEN表
                    if node not in self.OPEN and node not in self.CLOSE:
                        node.par = self.cur_node
                        self.OPEN.append(node)
                    # 出現在OPEN表中 比較OPEN表和M表中的fn值 若M<OPEN 在OPEN表中將該節點父節點設為當前節點
                    elif node in self.OPEN:
                        for node_open in self.OPEN:
                            if node == node_open and node.fn < node_open.fn:
                                # node_open.par = self.cur_node
                                node.par=self.cur_node
                                self.OPEN.remove(node_open)
                                self.OPEN.append(node)
                    # 出現在CLOSE表中 比較CLOSE表和M表中的fn值 若M<CLOSE 在CLOSE表中將擴充套件節點子節點指向當前節點(將當前節點父節點設為CLOSE表中擴充套件節點)彈出CLOSE表中的該節點加入OPEN表
                    elif node in self.CLOSE:
                        for node_close in self.CLOSE:
                            if node == node_close and node.fn < node_close.fn:
                                self.cur_node.par = node_close
                                self.CLOSE.remove(node_close)
                                self.OPEN.append(node_close)

                # 依照啟發資訊重排OPEN表
                self.OPEN.sort(key=lambda x: x.fn)

    def print_result(self):
        self.end_t = time.time()
        #列印路徑
        path_cnt = 1
        self.cur_node.print_state()
        while True:
            self.cur_node = self.cur_node.par
            self.cur_node.print_state()
            path_cnt += 1
            if self.cur_node.par == root_node:
                break
        print("number of searched node:%d" % len(self.G))
        print("number of CLOSE:%d" % len(self.CLOSE))
        print("Lenth of path:%d" % (path_cnt - 1))
        print("Time:%f" % (self.end_t - self.start_t))


if __name__ == '__main__':
    dicts = [[0, 1], [0, -1], [-1, 0], [1, 0]]  # 空格移動方向
    with open("./infile.txt", "r") as f:  # 讀取碼盤邊長和初始碼盤
        Lenth = int(f.readline().strip().split()[-1])
        List = list(map(int, f.readline().strip().split()))
    # 建立初始碼盤和目標碼盤
    Start = [List[i:i + Lenth] for i in range(0, len(List), Lenth)]
    GOAL_list = [i for i in range(1, Lenth * Lenth)]
    GOAL_list.append(0)
    GOAL = [GOAL_list[i:i + Lenth] for i in range(0, len(GOAL_list), Lenth)]

    root_node = Astar_node(0, 0, [[0] * 4] * 4, None)  # 建立樹根
    end_node = Astar_node(0, 0, GOAL, None)  # 建立目標節點
    start_node = Astar_node(0, 0, Start, root_node)  # 建立初始節點
    start_node.hn = manhattan_dis(start_node)

    time_limite=100
    Astar = A_start(start_node, end_node, manhattan_dis,time_limite)
    Astar.begin_search()

    os.system("pause")

總結

A*演算法確實是一個優秀的演算法,在親自編寫的過程中才體會到這個演算法的嚴謹和精妙之處。演算法有很強的擴充套件性和靈活性。對於很多問題的求解都適用。比如:路徑搜尋,圖搜尋等等。如果有機會希望能嘗試它的改進演算法的研究和實現。